본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

R과 더불어 배우는 통계학 상세페이지

R과 더불어 배우는 통계학작품 소개

<R과 더불어 배우는 통계학> 긴 망설임을 뒤로 하고, 10년 동안 다듬어온 강의노트를 책으로 출판하려 한다.
4차 산업혁명의 한 가운데를 지나며, 머신러닝, AI, 데이터 싸이언스, 빅데이타 등이 유망해지면서, 다양한 분야의 사람들이 통계학을 배우고 싶어한다. 저자의 수업에는 대부분 공학이나 경영학 등을 전공하는 학생들이 통계학을 선택 과목으로 한 학기만 수강한다. 한 과목만으로, 학생들이 확률 및 통계이론도 배우고, R도 배우려면, 정말 바쁘다. 오랫동안 이 책 저 책으로 가르치면서, 한 학기 분량의 비전공자들을 위한 통계책의 필요성을 절감했다. 학생들의 피드백을 받아가며, 학생들이 “쉽다”고 말할 때까지 책의 내용을 “자세히” 서술하였다.
이 책은 크게 세 부분으로 구성되어 있다. 첫 세 장은 R 을 이용하여, 표를 만들고, 그래프를 그리는 등 가장 흔히 만나는 기술통계를 다룬다. 독자들이 R 을 이용한 자료분석에 익숙해지도록, 코드에 대한 코멘트를 상세히 달았다. 두번째 세 장은 가장 기본적인 확률과 분포이론, 추정과 검정에 대한 기본 개념을 다룬다. 마지막 다섯 장은 확률이론을 근거로 엄밀하게 설계된 통계방법들의 이론과 R 을 이용한 자료분석 및 해석을 다룬다. 특히, 첫 세 장의 기술통계를 마지막 다섯 장의 통계이론에서 다시 복습할 수 있도록 구성하였다. 초중고 12 년 동안 객관식문항에 익숙해진 학생들을 위해서 객관식 및 단답식 연습문제를 많이 포함시켰다. 활용이 적은 내용을 버리는 대신, 각 장의 마지막에 논문이나 보고서 작성에서 필요한 실질적인 자료분석과 관련된 심화 내용들을 R 실습과 함께 수록하고, ★로 표시하였다. 매 장의 앞뒤에 저자가 흥미롭게
읽었던 책에서 구한 글귀들을 실어서, 잠시 쉬어 가도록 꾸몄다.
마지막으로 이 책이 나올 때까지 저자에게 격려와 도움을 아끼지 않은 많은 분들께 감사드린다. 서울성모병원 임상약리과에서 연구년을 보내는 동안, 통계학 교재를 쓰도록 물심양면으로 격려해주시고, 이후 원고를 읽고 수정해주신 임동석 교수님, 한승훈 교수님께 감사드린다. 늘 많은 질문을 던져준 의국 선생님들께도 감사드린다. 통계 이외의 분야에서 통계를 어떻게 배우고 사용하는지를 구체적으로 본 경험이 책을 서술할 때 도움이 되었다. 이 강의노트를 수업에 사용해주시고, 읽어 주신 김도영 교수님, 박진원 교수님께 감사드린다.
강의노트를 읽고 지속적으로 코멘트를 준 이해인에게 감사드린다. 가장 초기의 강의노트를 읽고, 읽기 쉬운 글을 요청한 김성진에게도 감사드린다. 시도때도 없는 저자의 수많은 질문에 늘 최선의 답을 준, 퉁친회 김남현, 김재희, 이윤동, 최영수 교수님, 그리고 권선희 박사님께도 감사드린다. 편집에 참여해준 박종한에게도 감사드린다. 무엇보다 저자의 강의에 참여하여, 수많은 영감을 준 학생들에게 깊이 감사드린다.
ebook 을 위해서, 책의 크기를 태블릿의 크기에 맞추었다. 내용이 주인공이 되고, 저자가 지속적으로 내용을 업데이트할 수 있도록, 불필요한 포맷을 간소화시켰다. 내용이 한 눈에 구조적으로 들어오도록 폰트를 다소 작게 잡는 대신, 정의, 정리, 예제 사이에 줄을 띄워서, 박스의 효과를 줬다. 폰트가 작게 느껴질 경우, 창을 키우거나 또는 태블렛을 가로로 돌려서 읽어도 좋다.
독자들의 전공이 하드웨어라면, 통계학은 그 위에 올려진 소프트웨어이다. 이 책이 통계라는 눈으로 바라보는 새로운 세상으로 독자들을 안내하는 길잡이가 되길 바란다.



저자 소개

현) 홍익대학교 세종캠퍼스 과학기술대학 교수

목차

목차
1. 서론 1
1.1 대수의 법칙 (Law of Large Numbers) 1
1.2 모집단과 표본 3
1.3 소프트웨어 R 8
1.4 부록 10
2. 일변량 기술통계 13
2.1 자료의 척도 (Measurement scales) 14
2.2 분포 16
2.2.1 척도에 따른 분포 16
2.2.2 분포의 중심 (Central tendency) 21
2.2.3 분포의 흩어짐 22
2.3 이상치 24
2.4 데이터 탐색을 위한 상자도표 26
2.5 변동계수★ 29
3. 이변량 기술통계 35
3.1 표본상관계수 및 최적 직선식 추정 36
3.2 최적 직선식의 추정 43
3.3 집단에 대한 기술통계 작성 및 상자도표 그리기 47
3.4 교차표 (Two-way table) 51
4. 확률과 확률변수 63
4.1 확률(Probability) 63
4.2 조건부 확률과 독립사건 67
4.3 베이즈 공식 71
4.4 확률변수와 확률함수 73
4.5 평균과 분산 77
4.6 이변수에 대한 결합확률함수 80
4.7 상관계수 83
5. 분포이론 91
5.1 초기하분포★ 92
5.2 베르누이 분포 93
5.3 이항분포 94
5.4 다항분포★ 99
5.5 정규분포 100
5.6 카이제곱 분포 106
5.7 t 분포와 F 분포 107
5.8 표본평균의 분포 110
5.9 중심극한정리 111
5.10 표본분포★ 114
5.11 포아송 분포★★★ 115
5.12 지수분포, 감마분포, 베타분포★★★ 120
5.13 기타 분포들 126
6. 추정과 검정 135
6.1 점추정★ 136
6.2 구간추정과 신뢰구간 137
6.3 가설과 검정 139
6.4 유의확률 p-값 142
6.5 신뢰구간의 의미 144
6.6 검정력과 표본크기★ 147
7. 일표본 T-검정 157
7.1 표본분포 복습★ 157
7.2 모분산을 모를 때, 모평균 μ에 대한 추론 158
7.3 정규성검정 161
7.4 일표본 윌콕슨 비모수검정 (Wilcoxon nonparametric test) ★ 163
7.5 일표본 분산의 신뢰구간과 가설검정★ 165
8. 이표본 T-검정 175
8.1 이표본의 표본분포★ 176
8.2 이분산 T -검정 178
8.3 등분산 T-검정 181
8.4 등분산성 검정을 위한 F-통계량 183
8.5 비모수 이표본 평균검정★ 185
8.6 쌍체 비교법★ 187
9. 회귀분석 197
9.1 단순회귀모형 198
9.2 최소제곱법을 이용한 최적 직선식 추정 200
9.3 분산분석을 이용한 회귀모형의 적합도 검정 202
9.4 추정된 계수의 유의성 검정 206
9.5 잔차도를 이용한 모형 진단 210
9.6 기타 방법을 이용한 회귀모형 진단★ 212
9.7 신뢰구간과 예측구간★ 216
9.8 더미변수를 사용한 다중회귀모형★★★ 218
9.9 모형의 선택★★★ 221
10. 분산분석법 239
10.1 일원배치 분산분석법 239
10.2 다중비교법 (Multiple comparison) 248
10.3 대비의 검정★ 251
10.4 이원배치법 (Two-way factorial design)★ 253
10.5 난괴법 (Complete Randomized Block Design; CRBD)★★ 258
10.6 공분산분석 ★★★ 262
11. 범주형 자료분석 275
11.1 일표본 모비율의 추정과 검정★ 276
11.2 이표본 모비율의 동일성 검정★ 278
11.3 적합도 검정 280
11.4 독립성 검정 283
11.5 위험도 ★★ 293
부록 A. R 시작하기 303
1. 배경 303
2. R의 설치 (Install R) 303
3. Start R 303
3.1 폴더 관리 304
3.2 스크립트(script) 저장하기 305
4. 연산, 벡터, 행렬 306
4.1 간단한 연산 306
4.2 새 변수 만들기 307
4.3 벡터 308
4.4 행렬 309
4.5 행렬식과 역행렬 311
4.6 연립방정식 311
4.7 고유값과 고유벡터 312
4.9 통계량 313
5. 데이터 314
5.1 데이터 프레임(Data frame) 314
5.2 내장 자료(built-in data) 316
5.3 데이터 쪼개기와 합치기(Subset or merge objects) 316
5.4 데이터 읽어들이기와 결과 내보내기(Import/Export data) 317
6. 제어문(Control structures) 319
6.1 if-else 319
6.2 apply와 aggregate 320
7. 함수 322
8. 수치 계산 323
9. 빅데이터 처리를 위한 함수 324
9.1 tibble 324
9.2 dplyr 325
부록 B. 표 330
표 1. 누적이항분포표 330
표 2. 표준정규분포표 336
표 3. 카이제곱 분포표 337
표 4. T 분포표 338
표 5. F 분포표 339
참고문헌 342
찾아보기 345


리뷰

구매자 별점

4.0

점수비율
  • 5
  • 4
  • 3
  • 2
  • 1

1명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전