본문 바로가기

리디북스 접속이 원활하지 않습니다. 새로 고침(F5)해주세요.
계속해서 문제가 발생한다면 리디북스 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

RIDIBOOKS

리디북스 검색

최근 검색어

'검색어 저장 끄기'로 설정되어 있습니다.


리디북스 카테고리



Do it! 데이터 분석을 위한 판다스 입문 상세페이지

책 소개

<Do it! 데이터 분석을 위한 판다스 입문> 파이썬 기초 문법만 알아도 OK!
테슬라 주식, 우버 택시 등 86개의 예제로 판다스의 기본을 빠르게 익혀보자!

전 세계 최대 규모의 파이썬 과학 콘퍼런스 사이파이(SciPy)에서 ‘판다스 튜토리얼 강의’를 진행하고 있는 저자의 손을 잡고 데이터 분석과 판다스에 빠르게 입문하세요. 파이썬 기초 문법만 알아도 괜찮습니다. 저자의 강의 노하우가 담긴 86개의 예제로 직접 키보드 잡고 배워 보세요. 테슬라 주식, 우버 택시, 빌보드 차트 등의 현실 데이터를 직접 분석하다 보면 쉽고 빠르게 판다스의 기본기가 완성됩니다.

※ 이 책은 PDF 북이므로 화면이 작은 단말기(스마트폰)에서는 보기 불편합니다. ※


출판사 서평

친절한 저자의 설명으로
복잡한 코드 속에서 방황하는 시간을 줄여보세요!
데이터 분석이라고 먼저 겁먹지 마세요. 훌륭한 길잡이와 함께라면 아무리 어려운 길이라도 갈 수 있습니다. 복잡한 코드는 나누고 어려운 내용은 최대한 풀어 친절하게 설명했습니다. 저자의 친절한 설명을 따라 여러분이 작성한 코드는 무엇이고, 어떤 데이터 분석 효과를 기대할 수 있는지 음미해 보세요. 복잡한 코드 속에서 방황하는 시간 없이 판다스 기본기에 집중할 수 있을 것입니다.

파이썬 기초 공부를 겨우 마친 초보자도 7일이면 판다스에 입문할 수 있습니다!
이 책은 파이썬이 아니라 판다스를 통해 데이터를 분석하는 과정에 집중합니다. 그래서 높은 수준의 파이썬 지식을 요구하지 않습니다. 그래서 파이썬 초보자라도 일주일 정도면 판다스에 입문할 수 있죠. 파이썬에 익숙한 독자라면 3일 만에 판다스의 기본기를 익힐 수 있습니다. 《Do it! 데이터 분석을 위한 판다스 입문》에서 제공하는 학습 계획표에 공부한 날짜를 기록하며 공부해 보세요.

내 손으로 데이터를 직접 만져야 내 것이 된다!
86개의 실습 예제를 입력하고 실행하며 판다스에 쉽고 빠르게 입문하자!
판다스는 파이썬으로 만든 데이터 분석 패키지입니다. 데이터 정제부터 분석, 통계, 그래프 시각화까지 데이터를 분석하는 데 필요한 모든 기능을 갖추고 있죠. 하지만 아무리 훌륭한 도구라 해도 사용하지 않으면 의미가 없겠죠? 그래서 이 책은 여러분이 판다스를 활용하여 데이터 분석의 주요 과정을 경험할 수 있도록 86개의 실습 예제를 제공합니다. 실습 예제를 따라 직접 데이터를 만져보고 결과를 확인하다 보면 어느새 판다스와 데이터 분석의 기본기를 갖춘 여러분을 발견할 수 있을 것입니다.

우버 택시, 테슬라 주식, 빌보드 차트, 에볼라 바이러스 데이터 등
현실 기반의 데이터를 분석하는 데이터 분석가가 되어보자!
만약 여러분이 이 책에서 사용하게 될 데이터가 ‘1, 2, 3’이나 ‘A, B, C’와 같은 의미 없는 데이터라면 어떨까요? 데이터의 분석 결과도 의미가 없을 것입니다. 그래서 이 책에서 사용하는 대부분의 데이터는 우버 택시, 테슬라 주식, 빌보드 차트, 에볼라 바이러스 등의 현실 기반의 데이터를 사용합니다. 다양한 데이터를 직접 만지고 분석하며 데이터 분석가가 된 기분으로 공부해 보세요.

책을 통해 스스로 성장하는 지적인 독자들을 만나보세요! ― Do it! 스터디룸 카페 안내
혼자 계획을 세우고 공부하다 보면 금방 지치기 마련이죠? Do it! 스터디룸 카페(cafe.naver.com/doitstudyroom)에서 나와 비슷한 고민을 하고 있는 독자를 만나 어려운 내용을 공유해보는 것은 어떨까요? 내가 열심히 공부한 내용으로 다른 사람을 도와준다면 더 큰 뿌듯함을 느낄 수 있지 않을까요? Do it! 스터디룸 카페에 방문해 보세요.



저자 소개

[저자 소개]
다니엘 첸(Chen, Daniel Y.)
데이터 분석 분야에서 활동 중인 저자는 2016년부터 매년 사이파이(SciPy)라는 국제적인 파이썬 커뮤니티에서 판다스 관련 강의를 맡아 진행하고 있다. 현재는 소프트웨어 카펜트리(Software Carpentry)에서 데이터 분석 언어인 R을 강의하고 있다. 한마디로 말하면 데이터 분석 언어인 판다스와 R을 모두 사랑하는 데이터 분석가이다. 현실 세계의 수많은 데이터를 분석하기 위해 반드시 알아야 하는 판다스 라이브러리를 초보자도 쉽게 이해할 수 있도록 그 동안의 강의 경험을 모두 녹여 이 책에 담았다. 86개의 실습 예제를 통해 현실 데이터를 직접 분석하며 판다스의 실무 기본기를 탄탄하게 익혀보자.

[옮긴이 소개]
김영하
새로운 기술에 관심이 많은 번역가이자 개발자. 삼성SDS, 미래에셋증권, GS홈쇼핑 등에서 다양한 실무 프로젝트를 수행하였으며 현재는 디플러스에서 데이터 분석 연구원 및 강사로 근무하고 있다. 주로 인공지능과 데이터 분석 분야에서 활발한 강의 활동을 하고 있으며 책 번역에도 관심이 많아 지금까지 《Splunk 앱 제작과 대시보드 개발》, 《파이썬 웹 스크래핑》, 《뷰티플 자바스크립트》, 《누구나 쉽게 배우는 스몰베이직》 등의 책을 번역했다.

목차

01장 판다스 실습 환경 준비하기
01-1 아나콘다 설치
아나콘다가 잘 설치되었는지 확인하기
01-2 판다스 실습 준비
실습 프로젝트 준비하고 프로젝트 폴더 살펴보기
01-3 안녕? 주피터 노트북!
01-4 파이썬 패키지 관리자 ─ pip

02장 판다스 시작하기
02-1 데이터 집합 불러오기
데이터 분석의 시작은 데이터 불러오기부터
시리즈와 데이터프레임
판다스와 파이썬 자료형 비교
02-2 데이터 추출하기
열 단위 데이터 추출하기
행 단위 데이터 추출하기
인덱스와 행 번호 개념 알아보기
loc, iloc 속성 자유자재로 사용하기
02-3 기초적인 통계 계산하기
02-4 그래프 그리기

03장 판다스 데이터프레임과 시리즈
03-1 나만의 데이터 만들기
03-2 시리즈 다루기 ― 기초
시리즈 속성과 메서드 사용하기 ─ index, values, keys
시리즈의 기초 통계 메서드 사용하기
03-3 시리즈 다루기 ― 응용
시리즈와 불린 추출
시리즈와 브로드캐스팅
03-4 데이터프레임 다루기
03-5 시리즈와 데이터프레임의 데이터 처리하기
03-6 데이터 저장하고 불러오기

04장 그래프 그리기
04-1 데이터 시각화가 필요한 이유
앤스콤 4분할 그래프 살펴보기
앤스콤 데이터 집합 모두 사용해 그래프 만들기
04-2 matplotlib 라이브러리 자유자재로 사용하기
기초 그래프 그리기
다변량 그래프 그리기
04-3 seaborn 라이브러리 자유자재로 사용하기
04-4 데이터프레임과 시리즈로 그래프 그리기
04-5 seaborn 라이브러리로 그래프 스타일 설정하기

05장 데이터 연결하기
05-1 분석하기 좋은 데이터
분석하기 좋은 데이터란?
05-2 데이터 연결 기초
행이 1개라도 반드시 데이터프레임에 담아 연결해야 합니다
다양한 방법으로 데이터 연결하기
05-3 데이터 연결 마무리

06장 누락값 처리하기
06-1 누락값이란?
누락값과 누락값 확인하기
누락값이 생기는 이유
누락값의 개수
누락값 처리하기
누락값이 포함된 데이터 계산하기

07장 깔끔한 데이터
07-1 열과 피벗
넓은 데이터
07-2 열 이름 관리하기
하나의 열이 여러 의미를 가지고 있는 경우
split 메서드로 열 이름 분리하기
07-3 여러 열을 하나로 정리하기
07-4 중복 데이터 처리하기
07-5 대용량 데이터 처리하기
여러 개로 나누어진 데이터 불러오기

08장 판다스 자료형
08-1 자료형 다루기
자료형 변환하기
잘못 입력한 데이터 처리하기
08-2 카테고리 자료형

09장 문자열 처리하기
09-1 문자열 다루기
파이썬과 문자열
인덱스로 문자열 추출하기
전체 문자열 추출하기
09-2 문자열 메서드
09-3 문자열 포매팅
문자열 포매팅하기
숫자 데이터 포매팅하기
% 연산자로 포매팅하기
09-4 정규식으로 문자열 처리에 날개 달기
정규식이란?

10장 apply 메서드 활용
10-1 간단한 함수 만들기
10-2 apply 메서드 사용하기 ─ 기초
10-3 apply 메서드 사용하기 ─ 고급

11장 그룹 연산
11-1 데이터 집계
데이터 집계하기 ─ groupby 메서드
분할-반영-결합 과정 살펴보기 ─ groupby 메서드
groupby 메서드와 함께 사용하는 집계 메서드
agg 메서드로 사용자 함수와 groupby 메서드 조합하기
여러 개의 집계 메서드 한 번에 사용하기
11-2 데이터 변환
표준점수 계산하기
누락값을 평균값으로 처리하기
11-3 데이터 필터링
11-4 그룹 오브젝트
그룹 오브젝트 살펴보기
한 번에 그룹 오브젝트 계산하기
그룹 오브젝트 활용하기
여러 열을 사용해 그룹 오브젝트 만들고 계산하기

12장 시계열 데이터
12-1 datetime 오브젝트
datetime 오브젝트로 변환하기 ─ to_datetime 메서드
시간 형식 지정자
datetime 오브젝트로 변환하기 ─ read_csv 메서드
datetime 오브젝트에서 날짜 정보 추출하기
dt 접근자 사용하기
12-2 사례별 시계열 데이터 계산하기
datetime 오브젝트와 인덱스 ─ DatetimeIndex
시간 간격과 인덱스 ─ TimedeltaIndex
시간 범위와 인덱스
시간 범위 수정하고 데이터 밀어내기 ─ shift 메서드


리뷰

구매자 별점

3.8

점수비율

  • 5
  • 4
  • 3
  • 2
  • 1

4명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

‘구매자’ 표시는 유료 도서를 결제하고 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기


spinner
모바일 버전