통계학은 데이터를 체계적으로 다루는 학문으로서, 여러 학문 분야뿐만 아니라 데이터를 다루는 실제 사회 현장에서도 그 응용범위와 필요성이 날이 갈수록 증가하고 있다. 더욱이 4차 산업혁명의 특징 중 하나인 초연결사회에서 발생하는 빅데이터를 활용하여 이를 과학적으로 분석해 의사결정에 이용하는 학문 분야로서 그 중요성은 어느 때보다 강조되고 있다. 이러한 배경에서 통계학은 학문 분야를 포함한 사회 여러 부분의 많은 이들에게 필수적인 학문이라고 할 수 있다.
이 책은 통계학을 전공하는 학생은 물론 이를 응용하는 여러 분야의 학생들을 위한 통계학 입문서이다. 통계학의 기반이 되는 자료를 요약 및 정리하는 방법과 확률이론에 대하여 알아보고, 기본적인 통계적 추론방법의 이론을 공부하여 다양한 예제와 컴퓨터 실습을 통해 실제 문제에서 쉽게 응용할 수 있도록 집필하였다.
또한 오늘날 통계학을 이용하여 데이터 분석을 하기 위해서는 통계소프트웨어를 활용하는 것이 필수적이라고 할 수 있는데, 이 책에서는 대표적인 통계소프트웨어 R과 최근 인공지능 및 빅데이터 처리에 가장 많이 사용되는 Python을 활용하였다. R과 Python은 일반적인 데이터부터 빅데이터까지 다양한 형태의 데이터 처리에 쓰이는 보편적인 프로그래밍 언어로서 인터넷을 통해 무료로 구할 수 있으며 수많은 통계 관련 라이브러리가 제공되고 있다. 또한, 지속해서 새로운 함수 등이 업데이트되어 다양한 최신 데이터 분석기법도 사용할 수 있다. 각 장의 마지막 부분에는 R을 이용한 예제와 그에 해당하는 Python 코드를 제시하여 그 장에서 소개한 내용에 대해 예제를 따라하면서 언어와 분석 방법을 익히도록 설계하였다.
장별 내용을 살펴보면, 1~2장에서는 간단한 그림과 수치들로 데이터를 정리 및 요약하는 기술통계학을 다루었고, 3~7장에서는 통계학의 이론적인 바탕을 이루는 확률이론과 다양한 확률분포이론에 대하여 소개하였다. 9~10장에서는 통계학의 중심 이론인 통계적추론에 대하여 설명하였고, 11~13장에서는 통계학의 대표적인 응용이론 몇 가지를 소개하였으며 마지막 14장에서는 최근 빅데이터 시대에 다시 각광을 받는 비모수 통계분석을 소개하였다. 통계학을 전공하는 학생들은 두 학기에 걸쳐 다룰 수 있으며, 통계학을 필요로 하는 다른 분야 학생들은 1장부터 10장까지 간단하게 다룬 후 11장 이후에는 관심 분야만을 취사선택하여 한 학기에도 다룰 수 있을 것으로 생각한다.
좋은 책을 위해 최선을 다했지만 부족한 부분이 있을 수 있다. 이 점은 양해를 바라며 출간 후에라도 수정사항이 있는 경우에는 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이니 참고하기를 바란다. 마지막으로 이 책이 나오기까지 도움을 주신 자유아카데미를 포함한 모든 분들께 감사의 마음을 전한다.