시계열 분석의 모든 것
실제 환경에 특화된 시계열 데이터 분석 및 모범 사례를 다루는 실무 지침서다. ARIMA 및 베이즈 상태 공간 같은 표준적인 통계 모델과 계층형 모델을 폭넓게 다루고, 시계열 데이터 모델링의 현대적인 파이프라인 전체를 실용적인 관점에서 안내한다. 이 책에 담긴 통계와 머신러닝 기술을 활용하면 데이터 엔지니어링 및 분석 과제를 해결하는 방법을 익히고, 시계열 데이터의 핵심을 꿰뚫어볼 수 있는 시각을 얻을 수 있을 것이다.
주요 내용
시계열 데이터 탐색 및 정리
탐색적 시계열 데이터 분석 수행
시간 데이터 저장
시계열 데이터 시뮬레이션
시계열 기능 생성 및 선택
측정 오류
머신러닝과 딥러닝을 활용한 시계열 예측 및 분류
정확도 및 성능 평가
예제 코드
github.com/deep-diver/practical-time-series-analysis-korean
추천사
파이썬과 R 코드를 번갈아 가며 사용합니다. 두 언어 중 한 언어에만 익숙한 독자도 이 책을 볼 수 있습니다. R 코드가 전반적으로 많지만 상세한 설명 덕분에 파이썬으로 쉽게 적용할 수 있습니다. 시계열 분석의 기본적인 부분을 전반적으로 잘 다룹니다. 매우 구조적이고 이해하기 쉽게 쓰였으며 디테일도 놓치지 않았습니다. 원서를 읽을 때는 좀 장황하다는 느낌을 받았지만 역자가 우리말로 옮길 때 이런 부분을 최대한 분명하게 표현하고자 노력했고, 번역서에서 흔히 발견되는 번역 투 표현을 최대한 깔끔하게 다듬었습니다. 마치 국내 저자가 저술한 서적처럼 깔끔하게 읽힙니다. 시계열 분석의 개념을 실무에 적용할 때 참조하기 위한 첫 번째 실전서로 추천합니다.
_임대경, P&G Korea 데이터 사이언티스트
누구나 잘못된 일기예보 때문에 낭패를 겪고 짜증을 낸 경험이 있을 것입니다. 하지만 시계열 모델을 한 번쯤 만든 경험이 있는 사람이라면 미래를 예측하는 일이 얼마나 어려운지 알기에 기상청에서 일하는 분들을 응원할 것입니다. 이 책은 회귀부터 딥러닝까지의 기법들을 숨 가쁘게 몰아치며 설명합니다. 오차를 다루는 대목쯤 되면 지칠 수도 있지만, 이 책의 역할은 방대한 시계열의 입구라는 사실을 명심하기 바랍니다. 여느 책과 달리 참고 문헌을 인용하는 것으로 그치지 않고 R과 파이썬을 MXNet과 텐서플로를 넘나들며 내용을 하나하나 설명합니다. 이 책을 덮는 순간부터 본격적인 시계열 공부가 시작될 겁니다. 시계열에 발을 딛는 모든 분의 무운(武運)을 기원합니다.
_이제현, 한국에너지기술연구원
인터넷 시대가 도래한 이후, 우리는 무수하게 쏟아지는 데이터 속에 살고 있습니다. 이 중에는 이미지 같은 정형 데이터도 있고 매일 겪는 날씨, 계절, 교통량 등 정해진 형태는 없지만 시간에 인과를 가진 데이터들도 있습니니다. 알파고에서 시작된 인공지능 붐 속에서 주류는 정형 데이터였고, 이후 정형 데이터를 가공하는 법을 알려주는 많은 책이 출간되었습니다. 하지만 시계열 데이터는 책의 한 챕터만 다루는 등 아쉬움이 많았습니다. 우리에게 중요한 것은 어떤 모델의 사용이 아니라 데이터에 맞는 가공법을 찾는 것입니다. 이 책은 시계열 형태라는 공통점만 가진 자료들을 데이터에 맞게 가공하고 사용하는 직관을 키우는 가이드입니다.
_시한, VAIS 인공지능 커뮤니티 운영진
시계열 문제를 처음 접하는 시린이(시계열 분석 어린이)라면 시계열 데이터라는 개념 자체가 굉장히 생소하게 느껴질 겁니다. 이 책에서 제공하는 시계열 데이터의 기본 개념과 코드를 실전에 활용하면 시계열 문제에 대한 감을 익힐 수 있습니다. 시계열 입문자라면 이 책이 좋은 길잡이가 될 수 있으리라 생각합니다.
_heroseo, 캐글 마스터
이 책은 데이터를 준비하는 과정부터 데이터 탐색, 데이터 가공, 머신러닝과 딥러닝을 이용한 모델 개발의 전반적인 과정을 소개합니다. 또한 의료, 금융, 정부 사례와 함께 시계열 분석 및 예측을 적용하는 데 필요한 아이디어도 제공합니다. 시계열 분석 및 예측을 수행하는 모든 비즈니스 의사결정자나 분석가에게 훌륭한 안내서가 되리라 확신합니다.
_ 김정민, GS ITM 기술전략팀 부장
시계열 예측을 구현하는 것은 어렵지 않으나, 높은 정확도로 좋은 예측 결과를 내는 것은 매우 어렵습니다. 아무리 훌륭하고 복잡한 알고리즘으로 구현하더라도 예측이 정확하지 않다면 쓸모없는 작업이 됩니다. 이 책에서는 정확한 미래 예측을 위한 데이터 가공 방법부터 다양한 예측 모델링 개발 및 적용 방법까지 체계적으로 설명합니다.
_문선홍, GS ITM 기술전략팀 부장
파이썬과 R 두 가지 언어로 시계열 데이터를 설명합니다. 특히 딥러닝의 경우 MXNet으로 처리한 과정을 눈여겨볼 필요가 있습니다. 기본적인 이론은 물론, 데이터 전처리부터 일반적인 시계열, 헬스케어, 주식시장 데이터까지 다룹니다. 시계열 데이터를 집중적으로 공부하고자 하는 독자에게 좋은 참고 자료가 될 것입니다.
_정용우, GS ITM 기술전략팀 부장