의과학 연구를 위한 의학통계학의 중요성이 나날이 커지면서 연구자들은 더 깊이 있는 연구 방법론의 적용 및 전개를 통해 의과학 발전에 크게 기여하고 있다. 그러나 의과학 연구를 위해 통계학을 처음 접하는 연구자들 대부분은 통계학이 너무 어렵다고 생각한다. 또한, 통계분석을 수행할 시간도 부족할 뿐 아니라 손쉽게 사용할 수 있는 통계 소프트웨어의 부재로 인해 연구에 매진하고 집중하는 데도 많은 어려움을 겪는다. 분석 결과를 해석하는 데도 상당한 어려움이 있어 체계적이고 정확한 해석을 하지 못하는 것이 현실이다. 대부분이 유료화되어 있는 통계 소프트웨어를 사용하기 위해서는 개인적으로 큰 금액의 비용을 들여야 하고, 이렇게 구입하고 나서도 분석 방법을 익히려면 예상보다 긴 시간을 학습에 투자해야 한다는 풀지 못할 숙제 또한 남아 있다. 이처럼 제대로 된 통계분석 방법의 적용과 통계 소프트웨어의 사용 용이성과 관련된 2가지 큰 문제로 인해 의과학 연구자들은 지속적으로 그리고 도전적으로 연구를 수행할 수 없는 현실에 직면해 있다. 필자는 이러한 문제를 해결하고자 이 책을 집필하였다.
이 책은 총 6장으로 구성되어 있다. 각각의 장은 의과학 연구에서 가장 많이 사용되는 통계적 분석 방법에 대한 간단한 이론 설명과 해당 방법에 대해 R을 통해 분석하는 구조로 구성되었으며, 기초통계분석 방법부터 고급통계분석까지 의과학 연구에 자주 사용되는 통계적 분석 방법 120개를 다루고 있다. 각 장에서는 연구자들이 쉽게 적용할 수 있도록 통계분석을 위한 통계적 방법에 대해 R 코드와 결과를 제시하고 설명하였으며, 실제 자료를 이용하여 의학 논문이나 국내외 학회지에서 자주 등장했던 통계적 방법을 의과학 현실에 맞게 해석하려 노력하였다.
통계적인 이론에 대한 접근보다는 분석 방법을 어떻게 적용하여 풀어나가는지를 보여주는 예제 중심으로 구성하였다. R을 자유자재로 활용하지 못하는 의약학, 간호학, 보건학 연구 등 의과학 연구를 담당하는 연구자들도 R에 대한 기초 지식만 있다면 손쉽게 분석 방법을 적용할 수 있도록 구성하였으니 좋은 지침서로 활용되기를 바란다. R의 버전은 R-4.2.1을 사용하였으며, 실습 자료는 대부분 공개 자료 사이트 Data and Story Library(DASL, https://dasl.datadescription.com/)의 자료와 R package가 내재하고 있는 예제 data를 이용하였다. 통계적 방법을 적용하기 위해서는 실습 자료를 먼저 살펴보고 분석에 임하기를 권장한다. 자료 입력 형태가 달라지면 R로 분석하기 어려워질 수 있으므로 R을 이용한 통계분석은 자료가 어떻게 입력되어 있는지, 변수명이 어떻게 설정되어 있는지 등을 반드시 알고 분석하기를 바란다.
좋은 책을 위해 최선을 다하였지만 미흡한 부분이 있을 수 있다. 이 점은 양해를 바라며, 이 책에서 사용된 실습 자료와 출간 후에 나오는 수정사항은 자유아카데미 홈페이지(www.freeaca.com) 자료실에 제공할 예정이다.
이 책을 통해 의과학 연구자들이 의학통계학에 보다 친근하고 익숙해질 수 있을 뿐만 아니라 통계학에 대해 자신감을 가져 의과학 연구를 더욱 활성화하고 발전시켜 나가기를 바라며, 의과학 연구를 더 훌륭하게 수행하기를 바란다.