본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

카프카, 데이터 플랫폼의 최강자 상세페이지

컴퓨터/IT 개발/프로그래밍

카프카, 데이터 플랫폼의 최강자

실시간 비동기 스트리밍 솔루션 Kafka의 기본부터 확장 응용까지
소장종이책 정가30,000
전자책 정가20%24,000
판매가24,000
카프카, 데이터 플랫폼의 최강자 표지 이미지

카프카, 데이터 플랫폼의 최강자작품 소개

<카프카, 데이터 플랫폼의 최강자>

데이터 플랫폼의 핵심 컴포넌트로 각광받고 있는, 이벤트 기반 비동기 아키텍처를 위한 고가용성 실시간 분산 스트리밍 솔루션 카프카(Kafka)의 모든 것!

국내 최대 모바일 플랫폼 회사인 카카오에서 '전사 공용 카프카' 서비스를 운영하고, 데이터 파이프라인과 빅데이터 플랫폼을 구축한 저자들의 풍부한 지식, 생생한 실전 경험, 노하우가 가득 담긴 책!


출판사 서평

카프카 사용자는 물론이고 아직 카프카를 도입하지 않은 기업이나 담당자들을 대상으로, 카프카를 손쉽게 설치하고 구성하는 방법, 비동기 메시지 처리법과 함께 프로그램 개발 방법도 차근차근 익혀본다. 또한, 손쉽게 메시징 시스템을 도입할 수 있도록 카프카의 내부 디자인과 프로듀서/컨슈머의 특징을 심도 있게 다뤘다. 아울러, 카프카를 데이터 버스로 활용해서 실시간 데이터를 분석하는 방법을 여러 방면의 예를 들어 자세히 설명하고, 카프카 기반의 실시간 데이터 분석 시스템을 개발하는 과정을 자세한 설명과 함께 샘플코드도 제공하고 있어서 실시간/배치 분석 업무를 수행하는 빅데이터 분석가나 데이터 엔지니어, 이벤트 기반 방식의 비동기 시스템 개발 업무를 맡은 모든 개발자에게 도움이 될 것이다.

[이 책의 독자 대상]
- 카프카를 배우고자 하는 초보자부터 카프카를 직접 운영하는 관리자
- 데이터 표준화와 실시간 처리에 대해 고민하는 개발자
- 이벤트 소싱을 활용한 데이터 처리를 활용하려는 개발자
- 효율적으로 데이터를 수집하고 처리, 분석하기를 원하는 개발자
- 실시간 데이터 파이프라인을 구축하고 애플리케이션을 개발하는 아키텍트와 개발자
- 이벤트 기반 방식의 비동기 시스템 개발 업무를 맡은 모든 개발자

[이 책의 내용과 특징]
- 카프카의 탄생 배경과 동작 원리
- 주키퍼와 카프카 설치 및 클러스터 구성에 대한 자세한 설명
- 자바와 파이썬을 이용한 카프카 프로듀서와 컨슈머의 예제 코드와 활용
- 카프카 운영에 필요한 주요 명령어 설명
- 주키퍼와 카프카의 노드 추가와 스케일 아웃 가이드
- 편리한 GUI 도구인 카프카 매니저의 설치와 활용
- 이해하기 쉽게 그림으로 설명하는 주요 카프카 아키텍처
- 카프카를 활용한 실시간 스트림 분석 완벽 가이드
- 엘라스틱서치와 아파치 나이파이 등을 활용한 데이터 파이프라인 구성 예제

[추천의 글]
빅데이터와 머신러닝, AI 등이 IT의 트렌드로 급부상한 오늘날 카프카는 선택이 아닌 필수가 되었습니다. 아직 국내에 카프카를 제대로 다룬 책이 한 권도 없는 상황에서, 이 책은 카프카를 도입하고자 하는 기업이나 이미 카프카를 도입했지만 적절히 활용하지 못하는 실무자들에게 단비 같은 존재가 될 것입니다.
이 책의 저자는 카카오에서 전사 공용 카프카를 실제로 운영하며 얻은 경험을 바탕으로 카프카에 대한 지식과 경험을 잘 정리했습니다. 친절한 설명과 그림으로 카프카의 기초부터 실무 적용까지 무리 없이 잘 정리되어 있어서 초보자들도 쉽게 이해할 수 있고 실무를 수행하는 데 도움이 될 것입니다. 대량의 데이터 처리를 고민 중이거나 카프카를 아직 접해보지 않은 분들에게 이 책을 강력히 추천합니다.
- 강소륜 / 넷마블게임즈 인프라실 이사

클라우드, 빅데이터, 인공지능, 블록체인 등은 IT 비전문가에게도 이미 친숙해진 4차 산업혁명의 핵심 키워드가 되었습니다. 이러한 4차 산업혁명을 지원하는 IT인프라를 구축할 때 가장 근간이 되는 기술 중 하나가 실시간 데이터 처리 플랫폼이며, 그 중심에 바로 오픈소스 프로젝트 카프카가 있습니다.
이 책이 특별한 이유는 오랜 기간 동안 현업에서 직접 개발하고 운영하면서 다양한 문제를 해결해 온 저자들의 열정과 고민이 책 속에 고스란히 담겨 있기 때문입니다. 이 분야 최고 전문가들의 지식과 노하우를 쉽고 빠르게 배우길 원하는 엔지니어들에게 이 책을 추천드립니다.
- 심탁길 / CJ올리브네트웍스 빅데이터센터 상무

"카프카?" 카프카라는 말을 듣고 물음표를 던지는 독자라면 반드시 이 책을 읽어보기를 추천한다. 카프카는 흔히 빅데이터 시스템을 구성할 때만 사용하는 것으로 착각하는 경우가 많다. 카프카는 데이터 수집뿐만 아니라, 이벤트 드리븐 시스템을 통한 느슨한 구현에도 최적화되어 있어, 최근 대부분의 서비스 기업들이 적극적으로 도입해 사용하는 오픈소스 솔루션이다.
이렇게 많이 사용되는 솔루션임에도 그동안 내부 동작 원리나 분산된 환경에서의 토픽의 정합성 등을 어떻게 유지하는지 등에 대한 구체적인 자료나 설명이 부족했던 현실에서 이 책은 그야말로 가뭄 속에 단비와 같은 책이라 할 수 있다. 특히 이 책의 3장과 4장은 카프카를 운영하거나 카프카 기반으로 시스템을 구성할 때 반드시 알아야 할 내용들을 자세히 소개하고 있으므로 이 책의 2부, 특히 3, 4장만으로도 이 책을 사서 읽을 만한 가치가 충분하다.
- 김형준 / 베터코드 CTO

카프카는 고가용성, 고성능 분산 스트리밍 솔루션으로서 기존 메시징 큐와 비교해 비휘발성과 내장애성이 높아, 최근 국내외 굴지의 대기업뿐만 아니라 데이터 플랫폼의 핵심 컴포넌트로서 도입, 운영하지 않은 회사를 꼽기가 어려운 정도다.
이 책은 현업에서 실제로 ‘전사 공용 카프카’ 서비스를 구축, 운영하고, 데이터 파이프라인과 빅데이터 플랫폼을 직접 만들어본 저자들의 실전 경험과 노하우가 풍부하게 담긴 책이다. 특히 이 책은 상세한 설치 가이드뿐만 아니라 카프카 운영 경험에서 비롯된 장애 대응 방법과 트러블슈팅, 모니터링 가이드 등이 상세하게 나와 있어 현업에서 카프카를 도입, 운영하려는 기업이나 담당자에게도 큰 도움이 될 것이다.
안정적이며 높은 성능을 발휘하는 데이터 파이프라인을 구축하고 여기서 나오는 데이터를 빠르고 정확하게 처리하는 애플리케이션을 만들려는 개발자와 아키텍트, 빅데이터 실시간 분석 처리 시스템을 구축하고자 하는 개발자 모두에게 적극 추천한다.
- 박재호 / 데일리 인텔리전스 CTO

1년 전에 이 책이 나왔더라면, 내가 카프카를 적용하는 데 그 많은 고생을 하지 않았을 것이다. 직접 카프카를 사용해서 우리나라에서 가장 많은 메시지 트랜잭션을 처리하는 일을 하고 있는 저자가 그동안 현업에서 스스로 배우고 겪은 노하우를 잘 정리한 책이다. 책의 각 페이지에는 독자의 이해를 돕기 위한 이미지와 소스 코드가 쉬운 설명과 함께 체계적으로 잘 정리되어 있다.
대용량으로 안정적인 데이터 처리를 할 수 있는 큐가 필요한 분들은 이 책으로 카프카를 접해 보길 추천한다.
- 이상민 / NHN Entertainment 기술리더, 『자바의 신』 저자

최근 들어 카프카는 느슨한 결합, 탈 중앙화, 대용량 처리, 실시간 처리, 확장 및 안정성의 키워드를 모두 수용하면서, 상용 MQ(Message Queue) 소프트웨어를 대체하고 있습니다. 과거 메시지 큐 기술이 메시징 처리 전체를 담당했던 데 반해, 카프카는 역할을 분리해 개념을 단순화했고 안정성과 확장성을 높였습니다. 또한, 카프카는 단순한 개념 덕분에 활용과 응용 범위를 넓히게 되었고, 빅데이터부터 마이크로서비스까지 거의 모든 환경에 핵심 요소로 자리 잡았습니다.
카프카는 이렇듯 쓰임새가 다양하기 때문에 실무적인 운영과 응용에 대한 노하우가 중요합니다. 지금까지 국내에서 출간된 카프카 도서는 기본 구성과 API 사용법에만 집중했다는 아쉬움이 있었습니다. 이런 의미에서 『카프카, 데이터 플랫폼의 최강자』의 출간은 더욱 반갑습니다. 실무에서 체득한 저자들의 다양한 경험을 바탕으로 기본 개념, 운영 고려사항, 모니터링, 데이터 파이프라인을 다루고, 최근에 나온 KSQL까지 포함하고 있습니다. 저자가 문서가 아닌 실무에서 익힌 기술로 집필했다는 사실이 피부로 느껴지는 책입니다. 카프카에 입문하고 실무 적용을 고려하시는 분들에게 적극 추천합니다.
- 김태완 / 한국 오라클 빅데이터 & Data Analytics팀 부장


저자 소개

- 고승범
카카오에 재직 중인 시스템 엔지니어로서 카카오와 관련된 여러 서비스를 지원하며 전사 공용 카프카와 래빗엠큐를 운영하고 있다. 새로운 것에 호기심이 많은 편이며 열심히 노력하는 엔지니어다. 팝잇(Popit.kr) 사이트의 저자로 활동 중이며 카프카 관련 글을 연재하고 있다.

- 공용준
국내 최대 메신저 회사에서 클라우드 서비스 개발 리딩을 맡고 있으며, 데이터 센터 자동화, 프라이빗/퍼블릭 클라우드 서비스와 그에 필요한 기술을 연구, 개발해서 실제 서비스에 적용하고 있다. 2015년에는 캐나다 밴쿠버에서 열린 오픈스택 서밋에서 국내 개발자 중 최초로 ‘SDN without SDN’이라는 제목으로 발표했고, 2016년(도쿄)과 2017년(몬트리얼) Netdev 컨퍼런스에서 역시 국내 최초로 확장가능한 컨테이너 네트워크에 대해 발표했다. 한국 데이터베이스 진흥원 자문위원, 클라우드컴퓨팅조합에서 멘토로도 활동 중이다.

목차

[1부] 카프카를 시작하며
1장 카프카란 무엇인가
1.1 카프카의 탄생 배경
1.2 카프카의 동작 방식과 원리
1.3 카프카의 특징
1.4 카프카의 확장과 발전
1.5 정리

2장 카프카와 주키퍼 설치
2.1 카프카 관리를 위한 주키퍼
2.2 주키퍼 설치
__2.2.1 주키퍼 다운로드
__2.2.2 주키퍼 실행
2.3 카프카 설치
__2.3.1 카프카 다운로드
__2.3.2 카프카 환경설정
__2.3.3 카프카 실행
2.4 카프카 상태 확인
__2.4.1 TCP 포트 확인
__2.4.2 주키퍼 지노드를 이용한 카프카 정보 확인
__2.4.3 카프카 로그 확인
2.5 카프카 시작하기
2.6 정리

[2부] 기본 개념과 운영 가이드
3장 카프카 디자인
3.1 카프카 디자인의 특징
__3.1.1 분산 시스템
__3.1.2 페이지 캐시
__3.1.3 배치 처리
3.2 카프카 데이터 모델
__3.2.1 토픽의 이해
__3.2.2 파티션의 이해
__3.2.3 오프셋과 메시지 순서
3.3 카프카의 고가용성과 리플리케이션
__3.3.1 리플리케이션 팩터와 리더, 팔로워의 역할
__3.3.2 리더와 팔로워의 관리
3.4 모든 브로커가 다운된다면
3.5 카프카에서 사용하는 주키퍼 지노드 역할
3.6 정리

4장 카프카 프로듀서
4.1 콘솔 프로듀서로 메시지 보내기
4.2 자바와 파이썬을 이용한 프로듀서
__4.2.1 메시지를 보내고 확인하지 않기
__4.2.2 동기 전송
__4.2.3 비동기 전송
4.3 프로듀서 활용 예제
4.4 프로듀서 주요 옵션
4.5 메시지 전송 방법
__4.5.1 메시지 손실 가능성이 높지만 빠른 전송이 필요한 경우
__4.5.1 메시지 손실 가능성이 적고, 적당한 속도의 전송이 필요한 경우
__4.5.2 전송 속도는 느리지만, 메시지 손실이 없어야 하는 경우
4.6 정리

5장 카프카 컨슈머
5.1 컨슈머 주요 옵션
5.2 콘솔 컨슈머로 메시지 가져오기
5.3 자바와 파이썬을 이용한 컨슈머
5.4 파티션과 메시지 순서
__5.4.1 파티션3개로 구성한 peter-01토픽과 메시지 순서
__5.4.2 파티션1개로 구성한 peter-02토픽과 메시지 순서
5.5 컨슈머 그룹
5.6 커밋과 오프셋
__5.6.1 자동 커밋
__5.6.2 수동 커밋
__5.6.3 특정 파티션 할당
__5.6.4 특정 오프셋부터 메시지 가져오기
5.7 정리

6장 카프카 운영 가이드
6.1 필수 카프카 명령어
__6.1.1 토픽 생성
__6.1.2 토픽 리스트 확인
__6.1.3 토픽 상세보기
__6.1.4 토픽 설정 변경
__6.1.5 토픽의 파티션 수 변경
__6.1.6 토픽의 리플리케이션 팩터 변경
__6.1.7 컨슈머 그룹 리스트 확인
__6.1.8 컨슈머 상태와 오프셋 확인
6.2 주키퍼 스케일 아웃
6.3 카프카 스케일 아웃
6.4 카프카 모니터링
__6.4.1 카프카 JMX 설정 방법
__6.4.2 JMX 모니터링 지표
6.5 카프카 매니저
__6.5.1 카프카 매니저 설치
__6.5.2 카프카 클러스터 등록
__6.5.3 카프카 매니저 메뉴
6.6 카프카 운영에 대한 Q&A
6.7 정리

[3부] 카프카의 확장과 응용
7장 카프카를 활용한 데이터 파이프라인 구축
7.1 카프카를 활용한 데이터 흐름도
7.2 파일비트를 이용한 메시지 전송
__7.2.1 파일비트 설치
__7.2.2 파일비트 설정
__7.2.3 카프카 토픽의 메시지 유입 확인
7.3 나이파이를 이용해 메시지 가져오기
__7.3.1 나이파이 설치
__7.3.2 나이파이 설정
__7.3.3 나이파이를 이용한 컨슈머 설정
7.4 실시간 분석을 위해 엘라스틱서치에 메시지 저장
__7.4.1 엘라스틱서치 설치
__7.4.2 엘라스틱서치 설정
__7.4.3 나이파이를 이용해 엘라스틱서치로 데이터 전송
7.5 키바나를 이용해 엘라스틱서치에 저장된 데이터 확인
__7.5.1 키바나 설치
__7.5.2 키바나 설정
7.6 현재의 토픽을 이용해 새로운 토픽으로 메시지 재생산
__7.6.1 나이파이를 이용한 카프카 컨슈머 추가
__7.6.2 나이파이를 이용한 토픽별 라우팅 작업
7.7 정리

8장 카프카 스트림즈 API
8.1 스트림 프로세싱 기초
__8.1.1 스트림 프로세싱과 배치 프로세싱
__8.1.2 상태 기반과 무상태 스트림 처리
8.2 카프카 스트림즈
__8.2.1 카프카 스트림즈의 특징과 개념
__8.2.2 카프카 스트림즈 아키텍처
8.3 카프카 스트림즈를 위한 환경설정
8.4 파이프 예제 프로그램 만들기
8.5 행 분리 예제 프로그램 만들기
8.6 단어 빈도수 세기 예제 프로그램 만들기
8.7 정리

9장 카프카 SQL을 이용한 스트리밍 처리
9.1 KSQL의 등장 배경
9.2 KSQL과 카파 아키텍처
9.3 KSQL 아키텍처
__9.3.1 KSQL 서버
__9.3.2 KSQL 클라이언트
9.4 도커를 이용한 KSQL 클러스터 설치
9.5 KSQL을 이용한 스트림 분석
__9.5.1 데이터 준비
__9.5.2 기본 스트림과 테이블 생성
__9.5.3 쿼리를 이용한 새로운 스트림과 테이블 생성
9.6 정리

10장 그 밖의 클라우드 기반 메시징 서비스
10.1 구글의 펍/섭 서비스 소개
10.2 구글의 펍/섭 서비스 연동
__10.2.1 구글 SDK 설치
__10.2.2 구글 펍/섭 CLI로 토픽 사용
10.3 펍/섭 파이썬 SDK 사용하기
__10.3.1 펍/섭 파이썬 라이브러리 설치
__10.3.2 구글 서비스 계정 인증정보 생성
__10.3.3 파이썬 SDK 사용하기
10.4 아마존 키네시스 서비스 소개
10.5 아마존 키네시스 연동
__10.5.1 아마존 CLI 설치
__10.5.2 아마존 CLI로 키네시스 사용하기
10.6 아마존 키네시스 자바 SDK 사용하기
__10.6.1 컨슈머 코드 예제
__10.6.2 프로듀서 코드 예제
10.7 카프카와 클라우드 서비스와의 비교
10.8 정리

[부록] 도커를 이용한 카프카 설치
A.1 도커 설치
__A.1.1 리눅스 버전 도커 설치
__A.1.2 맥 버전 도커 설치
__A.1.3 윈도우 버전 도커 설치
A.2 도커 버전 카프카 설치


리뷰

구매자 별점

4.0

점수비율
  • 5
  • 4
  • 3
  • 2
  • 1

7명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전