본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

마스터링 아파치 스파크(Mastering Apache Spark) 상세페이지

마스터링 아파치 스파크(Mastering Apache Spark)작품 소개

<마스터링 아파치 스파크(Mastering Apache Spark)>

아파치 스파크를 이용하여

빅데이터 처리 등 고급 스킬 습득을 위한 좋은 지침서!


이 책에서는 스파크의 각각의 모듈에 관해 기술하고 이것들이 어떻게 실제로 사용되는지를 설명할 것이다. 또한, 스파크의 기능이 H2O 같은 추가 라이브러리를 통해 어떻게 확장될 수 있는지도 보여줄 것이다. 그리고 아파치 스파크의 그래픽 프로세싱 모듈이 어떻게 아우렐리우스의 타이탄 그래프 데이터베이스와 함께 사용되는지도 보여줄 것이다. 이를 통해 스파크 GraphX와 타이탄을 그룹핑 함으로써 그래프 기반의 프로세스와 스토리지로 엮이는 것을 확인할 수 있을 것이다.



저자 소개

지은이 | 마이크 프램톤
IT 분야에 몸담고 있으며, IT 블로그 및 집필 활동을 통해 새로운 기술이나 빅데이터에 대한 통찰력을 보여주고 있다. 마이크는 1990년부터 IT 분야에서 일하며 테스트, 개발, 지원, 집필 등 폭 넓은 경험을 쌓았을 뿐만 아니라 에너지, 금융, 통신, 보험 등과 같은 비 IT 분야에서의 근무 경험도 가지고 있다. 마이크는 빅데이터, 인공지능, IT 분야에 대한 새로운 아이디어와 기술을 접하는 것을 좋아한다.


옮긴이 | 정기훈
현재 KT에서 유무선네트워크 기획·홍보 등의 업무를 하고 있으며 IT와 관련된 다양한 분야에 관심을 갖고 있다. 옮긴 책으로는 ‘Cocos2D 게임 프로그래밍’, ‘Learning Mac/iOS 개발자를 위한 오브젝티브-C 2.0’, ‘Learning iOS 게임 프로그래밍’ 등이 있으며, 저서로는 ‘원리로 이해하는 네트워크 입문’ 등이 있다.

목차

1장 아파치 스파크
1.1. 개요
1.2. 클러스터 디자인
1.3. 클러스터 관리
1.4. 성능
1.5. 클라우드
1.6. 요약

2장 아파치 스파크 MLlib
2.1. 환경 설정
2.2. 나이브 베이즈(Naïve Bayes) 분류
2.3. K-평균(K-Means) 클러스터링
2.4. ANN - 인공 신경망(Artificial Neural Networks)
2.5. 요약

3장 아파치 스파크 스트리밍(Streaming)
3.1. 개요
3.2. 오류 및 복구
3.3. 스트리밍 소스
3.4. 요약

4장 아파치 스파크 SQL
4.1. SQL 콘텍스트
4.2. 데이터 불러오기 및 저장하기
4.3. 데이터프레임
4.4. SQL 사용하기
4.5. 사용자 정의 함수
4.6. 하이브 사용하기
4.7. 요약

5장 아파치 스파크 GraphX
5.1. 그래프 개요
5.2. GraphX 코딩
5.3. Neo4j용 메이즈러너(Mazerunner)
5.4. 요약

6장 그래프 기반 스토리지
6.1. 타이탄(Titan)
6.2. 팅커팝(TinkerPop)
6.3. 타이탄 설치
6.4. HBase와 함께 타이탄 사용하기
6.5. 카산드라(Cassandra)와 함께 타이탄 사용하기
6.6. 스파크를 사용하여 타이탄에 접근하기
6.7. 요약

7장 H2O를 사용한 스파크 확장
7.1. 개요
7.2. 프로세싱 환경
7.3. H2O 설치
7.4. 빌드 환경
7.5. 아키텍쳐
7.6. 데이터 소싱
7.7. 데이터 품질
7.8. 성능 튜닝
7.9. 딥 러닝(Deep Learning)
7.10. H2O FLOW
7.11. 요약

8장 스파크 데이터브릭스(Databricks)
8.1. 개요
8.2. 데이터브릭스 설치
8.3. AWS 과금
8.4. 데이터브릭스 메뉴
8.5. 계정 관리
8.6. 클러스터 관리
8.7. 노트북과 폴더(Notebooks and folders)
8.8. 작업과 라이브러리(Jobs and libraries)
8.9. 개발 환경
8.10. 데이터브릭스 테이블
8.11. DbUtils 패키지
8.12. 요약

9장 데이터브릭스 시각화(Visualization)
9.1. 데이터 시각화
9.2. REST 인터페이스
9.3. 데이터 이동
9.4. 참고 도서
9.5. 요약


리뷰

구매자 별점

0.0

점수비율
  • 5
  • 4
  • 3
  • 2
  • 1

0명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전