10년 차 데이터 분석가의 실력 상승 비법을 담았다! 13가지 핵심 머신러닝 모델을 직접 구현하면서 머신러닝 입문자를 실무의 세계로 안내하는 책
이 책은 저자가 데이터 분석가로 10년 동안 일하며 깨달은 실력 상승의 비법을 예비 실무자에게 전하고자 집필한 책이다. 그 비법은 바로 기본으로 돌아가 선형 모델, 트리 모델 등 13가지 핵심 머신러닝 모델을 집중적으로 공부하는 것이다. 먼저 각 모델의 밑바탕에 있는 알고리즘 기초과 수리 이론을 살펴보고, 간단한 형태로 모델을 직접 구현해 본다. 그리고 최적화된 파이썬 패키지로 다시 모델링한 다음, 둘 사이에 어떤 차이가 발생하는지를 비교해 보며 머신러닝의 작동 원리를 탐구한다. 머신러닝은 이론만 공부하던 입문자가 처음 실무를 맞닥뜨릴 때 큰 어려움을 겪는 분야이다. 이때 겪는 어려움은 결국 실력이 쌓여야만 근본적으로 극복할 수 있다. 기본 모델을 깊이 이해할수록 다양한 모델들이 서로 동떨어져 있지 않고 기본 모델과 이론적으로 많은 부분을 공유한다는 사실을 깨달을 것이다. 그러고 나면 실제 업무나 연구에서 전보다 더 유연하고 효율적으로 머신러닝 모델링을 수행할 수 있을 것이다.
카이스트 수리과학과에서 학사와 석사 학위를 받은 후 실제 사회 현상에 대한 머신러닝 모델링에 관심이 생겨 카이스트 기술경영학부에서 박사 과정으로 머신러닝을 활용한 계량 마케팅을 전공했다. 영화나 드라마 등의 엔터테인먼트 산업에서 제품의 제목과 소비자 리뷰 등의 텍스트 정보를 이용해 매출을 모델링하는 연구로 박사 학위를 취득했다. 이후 삼성 SDS에서 데이터 분석가로 일하고 있다. 데이터 분석 교육, 검정, 인력 양성에 관심이 많아 현재 관련 업무를 담당하고 있다.