오늘날 확률론과 통계학은 학술연구 영역에 종사하는 연구자들만의 전유물이 아니다. 이제 기업에서는 경험과 직관보다는 데이터 분석에 기반하여 경영의사결정을 하고, 디지털 전환의 관점에서 조직 구성원 모두가 데이터를 다룰 수 있는 역량을 갖추도록 하고 있다. 의사결정시스템의 이러한 변화와 흐름은 기업체 재직자라면 누구에게나 데이터에 기반한 의사결정의 근원인 확률과 통계 지식을 습득해야 할 필요성을 제기한다.
이 책은 필자가 수년간 확률과 통계를 공부하고, 강의하며 작성했던 메모와 노트를 기초로 집필한 것이다. 필자는 대학의 교원으로 임용되기 전에 오랜 기간 산업체에 근무했고, 마흔이 넘은 나이에 직장을 다니면서 주경야독으로 석박사 학위를 공부했다. 학부를 졸업한 이후 십수 년 동안 손에서 놓았던 확률과 통계를 뒤늦게 대학원에 입학하여 다시 공부한다는 것은 매우 힘겨운 일이었다. 기초부터 다시 시작해야 했고, 학위논문에 적용할 고급 통계기법도 익혀야 했다. 학위 취득 이후 대학에서 확률과 통계를 가르친다는 것은 또 다른 차원의 도전이었다. 지식의 저주라고 했던가? 내가 이해하기 위해 공부하는 것보다, 타인을 이해시키기 위해 공부하는 것은 몇 배로 힘든 일이다. 이 책은 필자 스스로 이해하기 위해 지나온 시간이자, 필자의 강의 수강생들을 이해시키기 위해 지나온 시간의 기록이기도 하다. 따라서 이를 통해 확률과 통계에 대한 지식이 필요한 직장인과 전공 공부에 활용하고자 하는 학부생에게 도움이 되었으면 하는 마음으로 집필하였다. 이 책은 다음과 같은 특징이 있다.
첫째, 확률과 통계에 대한 기초적인 개념부터 보고서나 연구 저작물에 필요한 통계기법에 이르기까지의 내용을 망라한다. 특히 확률에 관한 내용이 전체 분량의 1/3 이상을 차지하고 있다. 이는 통계를 이해하기 위해서는 확률의 이해가 선행되어야 하기 때문이다. 그리고 확률과 통계의 개념을 이해하는 데에 필수적으로 필요한 미분과 적분의 원리를 내용에 포함하였다. 즉, 확률과 통계와 관련해서는 이 책 한 권이면 필요한 내용을 모두 찾아볼 수 있도록 구성하였다. 둘째, 데이터 분석 실습에는 전문 통계 패키지가 아닌, 마이크로소프트 엑셀과 자모비(Jamovi)를 사용하도록 하였다. 대부분 대학에서는 SPSS 또는 SAS와 같은 전문 통계 패키지로 학생들을 가르치고 있으나 라이선스 문제로 인해 졸업 이후에는 활용하기 힘든 문제가 있다. 라이선스 측면에서 접근성이 완전히 자유로운 소프트웨어를 사용한다는 것은 확률통계 지식을 실전에 적용하는 데 아무런 제약이 없도록 한다는 장점이 있다. 특히 자모비(Jamovi)는 무료 라이선스임에도 불구하고 SPSS 못지않은 퍼포먼스를 보여주는 통계 패키지이다. 셋째, 실습에 사용할 수 있도록 제공되는 데이터 중의 일부는 필자가 산업체 근무 시절 현장에서 수집하거나 연구논문에 활용했던 데이터들이다. 즉, 예제 풀이를 위해서 인위적으로 생성된 데이터가 아니라 현장감 넘치는 데이터라는 점이다. 이는 실전에서 수집된 데이터들이 교과서에서 다루어지는 정제된 데이터보다 훨씬 더 많은 전처리 과정을 수반하고 결과 해석에서도 더 많은 고민이 필요했던 경험을 이 책의 독자들에게 좀 더 생생하게 공유하고자 한 필자의 의도이다. 마지막으로, 이 책은 전체 내용을 49일 동안 하루하루 공부할 분량으로 분류하여 집필하였다. 독자 여러분은 이제 이 책에서 정해놓은 하루치 분량만큼만 매일매일 읽고, 제시된 예제를 풀이하고, 데이터를 다루기만 하면, 7주 후에는 확률과 통계, 그리고 데이터 분석에 자신감을 얻은 자신을 발견할 것이다.
좋은 책을 만들기 위해 최선을 다했지만 부족한 부분이 있을 수 있다. 이 점은 양해를 바라며 출간 후 나올 수 있는 수정사항과 실습용 데이터 파일 등은 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이니 참고하기를 바란다. 아무쪼록 길다면 길고, 짧다면 짧다고 할 수 있는 49일간의 확률통계 여정을 이 책과 함께 시작해 보자!