하둡 기반 대용량 데이터 저장, 관리의 핵심 솔루션 라는 부제를 가지고 있는 이 책에서는 HIVE(1.0.0) 에 대해서 설명하고, HQL, 성능, 보안, 다른 툴과의 연동에 대해서 설명하고 있어요.
출판
- 저자 : 다융 두, 김용환 옮김
- 출판사 : 에이콘출판
- 출간일 : 2017.02.28
목차
- 1장. 빅데이터와 하이브 소개
- 2장. 하이브 환경 설정
- 3장. 데이터 정의와 설명
- 4장. 데이터 선택과 범위
- 5장. 데이터 조작
- 6장. 데이터 집계와 샘플링
- 7장. 성능 고려 사항
- 8장. 확장성 고려 사항
- 9장. 보안 고려 사항
- 10장. 다른 툴과의 연동
개인평
SQL 에 익숙하다면 HQL 을 다루는데 큰 어려움은 없을 거예요. 빅데이터를 다루는데 HQL 을 상당히 많이 쓰이고 있어요. 책 구매 목적은 HQL 보다도 HIVE 에 대해서 놓치고 있는게 없을까? 많이 쓰이기 때문에 꼼꼼히 알아야 할 필요성이 있어 이 책을 구매하게 되었어요. 하지만 이 책의 대부분은 HQL 을 직접 사례로 들어가며 쿼리의 결과를 통해 HQL 을 사용법을 설명하고 있어요.
저는 이 책에서 얻고자 했던 것을 얻지 못했어요. SQL을 다뤄본 독자라면 HQL은 공식 문서나 웹 검색을 통해 익히는 것이 낳은 것 같아요.