본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

엔터프라이즈 데이터 플랫폼 구축 상세페이지

컴퓨터/IT 개발/프로그래밍

엔터프라이즈 데이터 플랫폼 구축

데이터 엔지니어, 시스템 관리자를 위한 온프레미스 하둡부터 클라우드까지 빅데이터 플랫폼의 모든 것

소장종이책 정가40,000
전자책 정가20%32,000
판매가32,000
엔터프라이즈 데이터 플랫폼 구축

작품 소개

<엔터프라이즈 데이터 플랫폼 구축>

자체 시스템부터 클라우드까지
엔터프라이즈 하둡과 빅데이터 플랫폼 운영, 구축, 설계의 모든 것


빅데이터 기술에 대한 정보는 넘쳐나지만 이 모든 기술을 매끄럽게 연결해서 완벽한 엔터프라이즈 데이터 플랫폼을 구축하는 기법은 포괄적으로 다뤄지지 않은 어려운 작업이다. 이 책은 성공적인 모던 데이터 플랫폼을 온프레미스(on-premise)는 물론 클라우드 상에 성공적으로 구축하기 위한 지식을 습득할 수 있는 실용적인 내용이 가득 담겼다.


출판사 서평

이 책은 엔터프라이즈 아키텍트, IT 관리자, 애플리케이션 아키텍트, 데이터 엔지니어에게 적합하며 하둡 프로젝트를 수행하는 동안 마주칠 수 있는 많은 도전과제들을 극복하는 방법을 소개한다. 또한 하둡과 빅데이터 환경 구축에 도움이 되는 광범위한 도구를 살펴볼 수 있을 것이다.

■ 인프라스트럭처: 서버부터 데이터센터에 이르기까지, 기업 데이터를 위한 견고한 기반을 확립하는 모던 데이터 플랫폼을 구성하는 모든 컴포넌트 계층

■ 플랫폼: 배포, 운영, 보안, 고가용성, 재해 복구를 비롯해 기업 IT 환경에 플랫폼을 융합하기 위해 알아야 할 모든 것

■ 클라우드 기반의 하둡: 기업이 요구하는 보안 및 고가용성을 확보한 빅데이터 플랫폼을 클라우드 상에서 운영하기 위해 알아야 할 중요한 아키텍처적 요소들


저자 소개

추천의 글
이 책의 저자들은 이 분야의 선구자들로 수년간 빅데이터로부터 실질적인 가치를 얻기 위한 기업들의 노력에 보탬이 되어왔다. 하둡, 임팔라, 하이브, 스파크의 사용자일 뿐만 아니라 오픈 소스 커뮤니티를 통해 이 프로젝트의 형태와 역량을 기업 환경에 맞추어 개선하는 데 적극적으로 도움을 주고 있다.
기업 환경에서 플랫폼을 운영하면서 데이터와 관련된 새로운 도전과제들이 생겨났다. 지금까지는 한 달이나 한 분기 정도의 데이터는 충분히 오랫동안 저장하고 검색할 수 있었지만 이제는 수십 년 혹은 수 세기의 데이터를 저장할 수 있다. 이렇게 큰 양적인 차이는 질적인 차이로 이어졌다. 한 세기의 데이터를 다루려면 어떤 새로운 애플리케이션을 개발해야 할까? 지금 여러분 앞에 놓인 이 책은 기업용 빅데이터 플랫폼을 개발하는 여러분이 품은 이런 질문에 대한 답을 찾기 위한 안내서다.
- 마이크 올슨(Mike Olson) / 클라우데라(Cloudera)의 설립자이자 최고 전략책임자(CSO)

업계에서 가장 경험이 많은 4인의 빅데이터 실무자들이 저술한 역작이다. 기술 및 문화적 측면을 모두 아울러 기업용 하둡 시스템을 구축하는 방법과 지식을 학습하고자 한다면 이 책이야말로 최고의 선택이다.
- 톰 화이트(Tom White) / 아파치 하둡 커미터, 『하둡 완벽 가이드』 저자

『엔터프라이즈 데이터 플랫폼 구축』은 데이터의 라이프 사이클 과정에서 데이터를 진정으로 활용할 수 있게 하는 데이터의 연계 기술을 다루고 있습니다. 데이터 관리는 생성 지점인 엣지에서 AI까지 어디서나, 조직 전체가 데이터 중심의 의사결정을 내릴 수 있게 해줘야 합니다. 이것이 엔터프라이즈 데이터 클라우드 플랫폼의 요구입니다. 귀사의 데이터는 안녕하십니까? 그 해답을 이 책에서 찾아보세요.
- 강형준 / 클라우데라코리아 지사장

『엔터프라이즈 데이터 플랫폼 구축』은 이런 하둡 에코 시스템을 어떻게 구축하고 관리할 것인지를 알려주는 책입니다. 현재 많은 기업들이 클라우드 플랫폼을 운영하고 있고, 클라우드 업체마다 쉽게 관리가 가능한 하둡 플랫폼을 제공해서 예전보다 하둡 플랫폼을 관리하는 노력이 줄어들었기 때문에, 과연 이렇게 상세하게 알아야 할까 하는 의문이 들 수도 있습니다. 하지만 아직도 금융권이나 정부 기관등 법적으로 클라우드 플랫폼을 제대로 사용할 수 있는 분야가 많으며, 아주 큰 기업들은 온프레미스라고 부르는 자신들의 IDC에서 서비스를 운영하기 때문에, 이런 지식은 여전히 필요합니다.
- 강대명 / beNX 엔지니어

이 책에서는 데이터 플랫폼 전반에 대해 각 분야별 전문가들이 다뤄야 할 고급 지식들을 알기 쉽게 그림으로 나타내어 데이터 플랫폼에 대해 깊이 알지 못하는 개발자나 엔지니어도 쉽게 이해할 수 있도록 잘 설명합니다. 또한 높은 성능뿐만 아니라 보안 및 안정성 등과 관련된 많은 기능들을 갖추고 있어 빅데이터 플랫폼 기술의 표준으로 자리잡은 하둡에 대해서도 심도 있게 다루며, 아울러 퍼블릭 클라우드 상에서의 데이터 플랫폼 솔루션들까지 상세히 설명합니다. 빅데이터와 관련된 일을 하는 모든 이의 필독서로 추천합니다.
- 고승범 / SKT 데이터 플랫폼 팀, 『카프카, 데이터 플랫폼의 최강자』 저자

『엔터프라이즈 데이터 플랫폼 구축』의 강점은 하둡 클러스터의 도입, 구축, 운영에 대해 실무에서 필요한 고려사항과 가이드를 모두 다룬다는 점입니다. 또한 하둡 엔지니어가 네트워크, 운영체제, 하둡 에코시스템, 데이터 관리 등 다방면에 걸쳐 고민해야 하는 기술뿐만 아니라, 해당 전문 엔지니어와 협의해야 하는 세부 주제 또한 잘 정리되어 있습니다. 무엇보다도 이 책은 클라우데라에서 CDH를 개발한 저자진이 직접 저술함으로써, 그들이 경험한 기술 고려사항부터 현장 경험과 노하우까지 모두 흡수할 수 있는 멋진 ‘데이터 플랫폼’ 실무서입니다.
- 김태완 / 한국오라클 빅데이터 엔지니어, http://taewan.kim/

하둡이 시장에 나온 지 오랜 시간이 지났고, 많은 조직에서 적극적으로 활용하는 기술로 자리를 잡았다. 각자의 환경과 목적에 맞는 컴포넌트를 활용하고 있다고는 하지만, 아쉽게도 현장에서는 기술 격차가 크게 존재한다. 이 책은 클라우드 기술까지 포괄하여 물리적인 아키텍처를 자세히 다룬다는 점에서, 엔터프라이즈급 규모를 운영하는 조직에 큰 도움이 될 것이다. 또한 상세하고 빈틈없는 설명으로, 하둡에 대한 기초적인 이해와 집중해야 하는 요소에 대한 인덱스 역할을 제공한다.
- 이태윤 / 카카오 데이터플랫폼팀 팀장

이 책의 구성과 독자대상
1부에서는 기반 인프라스트럭처에 대한 이해를 통해 클러스터에 대한 견고한 기반을 확립한다. 2부에서는 플랫폼을 전체적으로 살펴보고 외부 시스템과 부드럽게 통합되는 견고한 클러스터를 구현하는 방법을 알아본다. 3부에서는 하둡을 클라우드에서 운영할 때 아키텍처 면에서 중요한 내용을 다룬다. 또한 하둡과 하둡 생태계에 대한 입문 수준의 기술적인 내용들도 다룬다.

◆ IT 관리자
기업에서 하둡 클러스터를 운영하는 책임을 가진 독자: 1장, 2장, 5장, 14장

◆ 엔터프라이즈 아키텍트
하둡 클러스터 통합 및 다른 기업용 시스템과의 연동을 모든 면에서 관리하며 클러스터를 기업 표준에 따라 운영하고 관리해야 하는 독자: 1~4장, 6~7장, 9~18장

◆ 애플리케이션 아키텍트와 데이터 엔지니어
차세대 데이터 기반 애플리케이션을 디자인하는 개발자와 아키텍트로서 하둡을 위한 코드를 작성하고 그 역량의 장점을 취하고자 하는 독자: 1~2장, 9~13장, 17~18장

◆ 시스템 관리자와 데이터베이스 관리자(DBA)
클러스터의 운영 및 모니터링을 책임지며 클러스터 컴포넌트들의 동작 방식과 기반 하드웨어 및 외부 시스템과의 통합에 대한 깊은 이해가 필요한 독자: 1장, 2장, 3장, 6~18장

목차

1장 빅데이터 기술 기초 다지기
__하둡 에코시스템 둘러보기
__정리

[1부] 인프라스트럭처
2장 클러스터
__다중 클러스터 사용 이유
__멀티테넌시
__클러스터 용량 산정
__클러스터 확장
__데이터 복제
__정리

3장 연산과 스토리지
__하둡 이해를 위한 컴퓨터 아키텍처
__엔터프라이즈에 적합한 보급형 스토리지
__하둡과 리눅스 스토리지 스택
__이레이저 코딩과 복제
__로우레벨 스토리지
__서버 폼 팩터
__워크로드 프로파일
__클러스터 구성과 노드 종류
__정리

4장 네트워크
__서비스가 네트워크를 활용하는 방식
__네트워크 아키텍처
__네트워크 통합
__네트워크 설계 고려 사항
__정리

5장 조직의 과제
__누가 실행할 것인가
__인프라스트럭처인가 미들웨어인가 아니면 애플리케이션인가
__사례 연구: 보편적인 비즈니스 인텔리전스(BI) 프로젝트
__정리

6장 데이터센터 고려사항
__데이터센터는 왜 중요한가
__기본적인 데이터센터 개념
__공간과 랙 채우기의 제한
__데이터 수집 및 클러스터 간 연결
__교체 및 수리
__통상적인 위협
__정리

[2부] 플랫폼
7장 클러스터의 프로비저닝
__운영체제
__서비스 데이터베이스
__하둡 배포
__정리

8장 플랫폼 검증
__테스트 방법론
__유용한 도구들
__하드웨어 검증
__하둡의 검증
__다른 컴포넌트의 검증
__정리

9장 보안
__전송 중 암호화
__인증
__권한 부여
__유휴 시 암호화
__정리

10장 계정 서비스와의 통합
__통합이 필요한 영역
__통합 시나리오
__통합 계정 서비스
__LDAP 통합
__커버로스 통합
__인증서 관리
__정리

11장 클러스터의 접근 및 상호작용
__접근 메커니즘
__접근 토폴로지
__접근 보안
__워크벤치
__랜딩 존
__정리

12장 고가용성
__고가용성의 정의
__가용성의 측정
__고가용성의 운영
__고가용성 빌딩 블록
__일반적인 고려사항
__클러스터 서비스의 고가용성
__정리

13장 데이터 백업과 재해 복구
__컨텍스트
__데이터 복제
__하둡 클러스터 백업
__복구
__정리

[3부] 클라우드 기반 하둡
14장 하둡 가상화의 기초
__컴퓨트 가상화
__스토리지 가상화
__네트워크 가상화
__클러스터 수명주기 모델
__정리

15장 비공개 클라우드 솔루션
__오픈스택
__오픈시프트
__VMWare와 피보탈 클라우드 파운드리
__직접 만들어볼 텐가?
__비공개 클라우드를 위한 객체 스토리지
__정리

16장 공개형 클라우드 솔루션
__반드시 알아둘 것들
__클라우드 제공사
__클러스터 구현
__정리

17장 프로비저닝 자동화
__장기간 지속되는 클러스터
__일시적 클러스터
__메타데이터 공유 서비스
__정리

18장 클라우드 상의 보안
__위험의 평가
__위험 모델
__하둡을 위한 계정 프로바이더 옵션
__객체 스토리지 보안과 하둡
__감사
__유휴 시 데이터 암호화
__클라우드 상의 전송 중 데이터 암호화
__경계 제어와 방화벽
__정리

부록 백업 온보딩 체크리스트
____백업 온보딩 체크리스트
____서비스


리뷰

구매자 별점

5.0

점수비율

  • 5
  • 4
  • 3
  • 2
  • 1

1명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전