최근 데이터과학 분야가 중요한 화두로 떠오르면서 통계학에 대한 관심도 크게 증가하였다. 필자들의 수업에는 부전공이나 복수전공으로 통계학을 선택한 다양한 학과의 수강생들이 존재한다. 과거에는 전통적으로 관련이 있는 컴퓨터공학과, 소프트웨어학과, 경영학과 등이 중심이었다면 지금은 행정학과, 관광학과, 중국어학과, 실용음악과 등 아주 다양한 학과의 학생들도 관찰된다. 심지어는 통계학과로 전과하는 경우도 점차 늘어나고 있다. 본서는 이렇게 배경지식도 다르고 전공분야도 다른 다양한 학생들이 통계학의 기본개념을 이해하고 자신들의 분야에서 이를 활용할 수 있도록 도움을 제공하기 위해 집필되었다. 이를 위해 특별히 다음 사항에 많은 생각과 시간을 투자하였다.
첫째, 수리적인 표현을 어디까지 얼마나 쓰는 것이 바람직한가? 수학적 배경지식이 있는 수강생들은 수리적 표현을 통해 간결하고 직관적으로 설명하는 것을 더 선호한다. 반면, 수리적 표현을 보면 먼저 겁부터 느끼는 다수의 수강생도 존재한다. 이들 사이에서 적절한 균형점을 찾기 위해 노력하였다. 중요한 정리들은 수리적인 증명보다는 수학적 표현에 익숙해지고 어떻게 활용되는지에 초점을 맞추어 설명하였다.
둘째, 가설검정을 다루는 단원에서는 유의확률(p-값)을 계산하고 이를 바탕으로 검정의 결과를 기술하는 방식을 채택하였다. 확률계산이 어려웠던 과거에는 몇 장의 통계수표에 의존해서 가설검정을 진행하였으며 아직도 많은 교과서가 이 방식을 이용하고 있다. 그러나 R을 비롯한 모든 통계패키지들은 검정의 결과로 유의확률(p-값)을 출력하기 때문에 이를 이용한 가설검정법이 통계패키지를 이용하는 데 훨씬 더 현실적인 방법이 될 수 있다. 또한, 본서에서는 R의 검정함수가 출력하는 유의확률(p-값)이 어떻게 계산된 것인지를 이해시키고 직접 계산하여 확인할 수 있도록 지도하고 있다.
셋째, 데이터분석뿐만 아니라 통계학의 이해과정에서 R을 적극적으로 활용하려고 노력하였다. 각 확률분포의 그래프나 부록에 있는 통계 분포표를 R을 이용하여 직접 제작할 수 있도록 설명하였다.
여러 해의 강의를 통해 편집되고 정리된 원고를 바탕으로 자유아카데미 편집부 여러분의 많은 수고가 있었다. 필자들의 노력과 함께 출판과정에서 많은 분들의 수고가 있었지만 여전히 미진하거나 부족한 부분이 나올 수 있다. 이러한 점은 양해를 바라며 출간 후에라도 나올 수 있는 수정사항 등은 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이니 참고하기를 바란다. 아무쪼록 이 책이 통계학을 이해하고 활용하려는 독자들에게 작은 도움이라도 되길 염원한다.