Link Search Menu Expand Document

스파크 창시자가 알려주는 스파크 활용과 배포, 유지 보수의 모든 것 오픈소스 클러스터 컴퓨팅 프레임워크인 스파크의 창시자가 쓴 스파크에 대한 종합 안내서입니다. 스파크 사용법부터 배포, 유지 보수하는 방법까지 포괄적으로 익힐 수 있습니다. 스파크 2의 개선점과 새로운 기능을 자세히 설명합니다. 구조화된 스파크 API의 특징과 공통 기능은 물론이고, 엔드 투 엔드 스트리밍 애플리케이션을 구축하는 새로운 고수준 API인 구조적 스트리밍을 함께 살펴봅니다. 이 책을 읽으면 스파크를 모니터링, 튜닝, 디버깅하는 데 필요한 기본 지식을 습득할 수 있습니다. 나아가 스파크의 확장 머신러닝 라이브러리인 MLlib을 사용하는 방법과 시나리오를 익힐 수 있습니다. (교보문고 발췌)

교보문고 스파크 완벽 가이드

출간

  • 저자 : 빌 체임버스, 마테이 자하리아
  • 옮김 : 우성한, 이영호, 강재원
  • 출판 : 한빛미디어, 2018.12.12

목차

  • Part 1 빅데이터와 스파크 간단히 살펴보기
  • Part 2 구조적 API: DataFrame, SQL, Dataset
  • Part 3 저수준 API
  • Part 4 운영용 애플리케이션
  • Part 5 스트리밍
  • Part 6 고급 분석과 머신러닝
  • Part 7 에코시스템
  • 부록 A 스파크 설치 및 실행
  • 부록 B 더블린 원정대: 스파크 서밋 2017 더블린 참관기

개인평

책의 전체적인 느낌은 상당히 깊이 조절이 잘 되어지고 잘 짜여져 있다는 느낌이예요. 적절한 코드 예제와 어플리케이션 개발 및 상용 서비스 적용시에 챙겨야하는 포인트들을 집어주고 있어요. 스파크를 배우는 개발자에게 스파크에 대한 인덱싱을 만들어 주어, 전체적인 그림을 그려주고 각 인덱스별로 깊이 있는 학습을 할 수 있도록 해줘요.

개인적으로 ‘고급분석와 머신러닝의 개요’ 파트는 전반적인 방법론들을 설명해 주고 있어서, 머신러닝의 막연한 두려움 사라지게 해주는 가장 재미있게 봤던 파트예요.

기억하기위해서 머신러닝 파트만 요약해서 별도 포스팅 해볼 예정이예요.

이 책을 추천해요