도서 이용 안내 서점에서 판매 중인 리얼타임 시리즈는 DRM-Free 도서가 아닙니다.
DRM-Free 도서는 한빛미디어 홈페이지에서 별도 구매하셔야 합니다.
도서 이용에 참고 부탁드립니다.
[리얼타임] 처음 시작하는 임팔라 : SQL로 하둡을 다루는 가장 쉬운 방법
작품 정보
"빅데이터를 여는 열쇠, SQL온하둡(SQL-on-Hadoop)의 선두주자, 임팔라!
아파치 하둡 에코시스템은 데이터에 중점을 두고 있어 SQL 경험이 있는 데이터베이스 개발자에 안성맞춤이다. 하둡 애플리케이션 개발 작업의 많은 부분이 데이터 파일을 복사하고 변환하고 재조직화하여 분석하는 프로그램을 작성하는 일로 이루어져 있다. 이러한 일들을 대규모 병렬 방식의 네트워크 장비로 묶인 클러스터에서 신뢰성 있게 수행하려면 엄청난 노력이 필요하다.
임팔라는 이러한 활동을 쉽고 빠르게 해주기 때문에 분산 컴퓨팅에 관한 전문적인 지식이나 새로운 API를 배울 필요도 없다. 심지어 수행하려는 작업이 단일 SQL 문장으로 표현할 수 있을 정도라면 프로그램을 작성할 필요조차 없다.
이 책은 데이터베이스 경험은 있지만 아파치 하둡 소프트웨어 스택 경험은 없는 사람을 대상으로 임팔라 아키텍처와 사용법 측면에서 사례를 알려준다. SQL 예제는 이해를 돕는 단순한 예제를 시작으로 고성능과 확장성을 보여주는 모범사례를 다루는 예제로 확장해 나간다.
이 책의 대상독자
이 책은 데이터베이스, 데이터 웨어하우스, 빅데이터에 관한 지식이 있는 독자를 대상으로 한다. 따라서 CREATE TABLE, SELECT, INSERT 같은 구문과 주요 절에 관한 설명이 따로 필요 없을 정도로 독자는 SQL에 충분히 경험이 있다고 가정한다. 또한, 리눅스 경험이 있으면 더욱 좋다. 아파치 하둡 소프트웨어 스택 경험이 있으면 유용하나 필수는 아니다."