본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

데이터 분석을 위한 수리 모델 입문 상세페이지

컴퓨터/IT 개발/프로그래밍

데이터 분석을 위한 수리 모델 입문

데이터 사이언스 시리즈 064 | 데이터 뒤의 숨겨진 본질 파악하기
소장종이책 정가27,000
전자책 정가26%20,000
판매가20,000
데이터 분석을 위한 수리 모델 입문 표지 이미지

데이터 분석을 위한 수리 모델 입문작품 소개

<데이터 분석을 위한 수리 모델 입문>

《데이터 분석을 위한 수리 모델 입문》은 데이터를 분석하고 응용하는 데 꼭 필요한 도구인 ‘수리 모델’에 관해 전반적인 내용을 그려볼 수 있는 조감도의 시점으로 설명하는 입문서입니다. ‘수리 모델’의 범위는 매우 넓어서 어디에 무엇이 있는지 정리하는 데만도 엄청난 양의 작업을 수행해야 합니다. 이 책에서는 기본 주제에서 최대한 벗어나지 않으면서, 단지 정보를 나열하는 것이 아니라 그것이 어떤 목적에 사용되고 어떤 아이디어를 기반으로 하는지, 또 서로 어떤 관계에 있는지 등의 내용을 연계해서 한 권의 입문서로 정리했습니다.

다양한 학문에서의 수리 모델 기법들은 모두 달라 보이지만, 데이터가 생성되는 원리를 잘 나타내는 수리 모델을 구축하고 그 수리 모델에서 정보를 얻어낸다는 기본 개념은 같습니다. 따라서 공통 개념이나 과정, 그리고 사용자가 직면하는 과제가 모든 기법에 존재합니다.

이 책에서는 수리 모델을 사용한 데이터 분석의 본질적인 부분을 골라내면서 데이터 분석을 넓은 시점에서 살펴보는 방식으로 설명을 진행합니다. 이러한 설명을 통해 다음과 같은 요구에 대해 적절한 답을 제시하고자 합니다.

수리 모델을 사용해서 데이터를 분석하면 어떤 일이 가능한지 알고 싶다.
현재 사용하는 수리 모델이 적절한 모델인지 알 수 없고, 다른 방법이 있다면 그 방법을 어떻게 찾아야 할지 알고 싶다.
수리 모델의 움직임이나 성질을 공부해서 데이터를 본질에 더 가깝게 분석하고 싶다


저자 소개

에자키 타카히로
도쿄대학 첨단과학기술 연구 센터 특임 강사. 2011년 도쿄대학 공학부 항공우주공학과 졸업. 2015년 동대학원 박사 과정 수료(특례 적용에 의해 1년 단축), 박사(공학). 일본 학술진흥회 특별 연구원, 국립정보학연구소 특임 연구원, JST 선도 연구원, 스탠포드 대학 객원 연구원을 거쳐, 2020년부터 현직. 도쿄대학 총장상, 이노우에 연구 장려상 등 수상. 수리적 해석기술을 무기로 통계물리학, 뇌과학, 행동경제학, 생화학, 교통공학, 물류과학 등 폭넓은 분야의 문제에 대처하고 있다.

목차

[01부] 수리 모델이란

▣ 01장: 데이터 분석과 수리 모델
1.1 데이터를 분석하는 일
___인간이 인지할 수 있는 한계와 데이터 분석
___대상을 데이터 생성 시스템으로 생각한다
___데이터 분석의 세계
___두 가지 접근법
1.2 수리 모델의 역할
___데이터를 바라보는 것 이상의 분석이 필요하다면 수리 모델을 사용할 때
___수리 모델은 ‘가정하는 것’이다
___수리 모델을 구성하는 요소
___일단 변수로 표현해보자

▣ 02장: 수리 모델을 구성하는 요소와 종류
2.1 변수 수리의 구조 매개변수
___수리 모델을 구성하는 요소
___일단 변수로 표현해보자
___수리구조 = ‘수리 모델의 뼈대’
___매개변수는 수리 모델을 ‘움직인다’
2.2 수리 모델과 자연과학의 기초 이론
___확립된 수리 모델은 기초 이론이 된다
___경계조건과 계산의 난이도
2.3 이해 지향형 모델링과 응용 지향형 모델링
___목적에 따라 모델링은 크게 달라진다
___모델이 복잡한 정도와 쉽게 이해할 수 있는 정도
2.4 이해 지향형 모델링
___이해 지향형 모델링 방법
___(1) 수리 구조를 통해 설명하는 방법
___(2) 추정한 매개변수의 값을 통해 설명하는 방법
___(3) 추정된 잠재변수나 내부 표현을 사용해 그 다음 부분을 해석하는 방법
___(4) 수리 모델에 있는 매개변수를 변화시키면서 상황을 시뮬레이팅하는 방법
2.5 응용 지향형 모델링
___수리 모델의 데이터 생성능력을 활용한다
___예측모델의 예1: 값을 예측한다(회귀)
___예측모델의 예2: 분류 문제
___생성모델을 사용한 응용
2.6 수리 모델의 한계와 적용 범위
___‘옳은’ 수리 모델?
___좋은 수리 모델도 항상 옳지는 않다

[02부] 기초적인 수리 모델

▣ 03장: 방정식 모델
3.1 선형모델
___변수 사이의 관계를 등식으로 표현한다
___선형모델
___선형모델을 구한다
___최소제곱법
3.2 실험식과 커브 적합
___BMI와 수리 모델
___멱법칙으로 특징짓는다
___대수플롯으로 멱법칙을 찾는다
___실험식
3.3 최적화 문제
___목적한 양을 제어한다
___대역적 최적과 국소적 최적
___매개변수를 조정하는 일도 최적화
___최적화를 어렵게 만드는 요소

▣ 04장: 미분 방정식으로 구성된 모델
4.1 풀 수 있는 미분 방정식 모델
___미분 방정식을 통해 시간 변화를 나타낸다
___맬서스의 개체 수 모델
___맬서스 모델의 해의 구조
___개체 수가 계속 폭발적으로 늘어나는 것은 아니다
___간단한 연립 선형 미분 방정식
___두 개의 연립 미분 방정식
___연립 1계 선형 상미분 방정식
___‘고윳값’에 의해 해의 성질이 결정된다
4.2 비선형 미분 방정식 모델
___비선형인 항을 포함한 미분 방정식 모델
___로트카-볼테라 방정식
___‘정상’인 상태에 관해 생각해 보자
___정상해의 ‘안정성’
___안정성을 실제로 평가한다
___미분 방정식을 선형화해서 해석한다
___수치 시뮬레이션
4.3 풀 수 있은 모델과 풀 수 없는 모델
___풀 수 있는 미분 방정식은 많지 않다
___선형인 미분 방정식
___1 변수인 비선형 미분방정식
___편미분 방정식
___분석 소프트웨어를 이용한다
4.4 제어이론
___입력변수에 대해 시스템이 어떻게 응답하는가
___미분 방정식을 풀기 위해 사용되는 도구
___라플라스 변환으로 미분 방정식을 푼다
___미분 방정식에 제어항을 넣어보자
___목푯값을 달성하기 위한 피드백을 생각한다
___고전 제어이론과 현대 제어이론, 그리고 그 이후

▣ 05장: 확률모델
5.1 확률과정
___확률적인 상황을 생각해 보자
___확률분포는 확률의 정보를 모아 놓은 것이다
___연속변수의 확률분포
___연속변수의 확률분포: 확률밀도함수
___주사위를 여러 번 던진다
5.2 마르코프 과정
___마르코프 과정은 과거의 상태를 무시한다
___점심 메뉴 정하기
___어떤 비율로 라면을 먹게 될까
___상태확률의 방정식을 세운다
___시간이 충분히 경과한 후
5.3 대기행렬이론
___창구의 대기줄을 확률적으로 표현한다
___평균적인 움직임에 기반한 추측
___사용자가 무작위로 도착하는 모습을 표현한 포와송 과정
___커지고 작아지는 모습을 표현하는 출생사멸 과정
___대기줄의 길이를 확률적으로 구한다
___정상상태 분석
___확률분포를 알면 기댓값을 구할 수 있다
___확률모델의 강점과 한계
___수치적인 해석은 비교적 쉽다
___마르코프 근사

▣ 06장: 통계모델
6.1 정규분포
___뱀 주사위 놀이 결과
___정규분포는 확률분포의 왕
___정규분포의 정의
___다른 정규분포끼리 덧셈한 것도 정규분포
___정규분포를 제곱해서 덧셈하면 어떻게 될까?
6.2 통계적 검정
___분산에 관해 생각해 본다
___우연의 확률
___평균에 관한 검정
___통계검정은 만능이 아니다
___1종 오류와 2종 오류
___통계검정 실시
6.3 회귀분석
___선형모델의 타당성
___같은 선형모델에서 나타나는 차이
___피어슨 상관계수로 평가한다
___선형식과 잘 부합되기만 하면 괜찮을까?
___변수의 개수가 많을 때는 중회귀분석
___X 선형이 아닌 모델

[03부] 수준 높은 수리 모델

▣ 07장: 시계열 모델
7.1 시계열 데이터를 구성하는 구조
___다양한 시계열
___여러 가지 접근법
___트렌드+성분+노이즈
___주파수 성분
___특정한 비선형 구조가 있는 경우
___시계열이 정상인지를 알아본다
___시간을 설명변수로 사용해서 통계검정을 실행하면 안 된다
7.2 관측변수를 사용한 모델
___예측에 사용할 수 있는 모델들
___AR 모델
___ARMA 모델
___ARIMA 모델
___SARIMA 모델
7.3 상태공간 모델
___상태변수를 포함한 모델
___상태공간 모델의 일반적인 표현
___이산시간, 선형, 가우스 모델
___다른 경우의 상태공간 모델
7.4 그 밖의 다양한 시계열 분석법
___자기상관으로 시간구조를 특징짓는다
___이상확산으로 특징짓는다
___푸리에 변환으로 주파수를 해석한다
___카오스, 비선형 시계열 해석
___두 개 이상의 시계열에서 인과관계를 조사한다

▣ 08장: 머신러닝 모델
8.1 머신러닝으로 다루는 모델과 문제의 특징
___머신러닝의 기본적인 개념
___복잡한 문제, 복잡한 모델
___모델의 자유도와 오버피팅
___머신러닝 모델을 사용해서 분석한다
8.2 분류와 회귀 문제
___분류와 회귀
___결정 트리
___랜덤 포레스트
___서포트 벡터 머신
___신경망
8.3 클러스터링
___클러스터링으로 데이터를 해석한다
___k-평균법
___혼합분포 모델
___계층적 클러스터링 기법
8.4 차원축소
___차원축소란
___주성분 분석
___독립성분 분석
___비선형인 차원축소법
8.5 딥러닝
___딥러닝이란
___컨볼루션 신경망
___순환 신경망
___오토인코더
___적대적 생성 네트워크

▣ 09장: 강화학습 모델
9.1 행동 모델인 강화학습
___강화와 학습
___도박 문제
___행동 선택을 포함한다
___모델의 다양성과 발전
___행동모델로 사용한다
9.2 머신러닝 분야의 강화학습
___머신러닝 분야의 강화학습
___가치 함수의 성질을 결정한다
___가치 함수를 갱신한다
___딥러닝을 사용한 Q 학습
___Q 학습 이외의 방법

▣ 10장: 다체계 모델(행위자 기반 모델)
10.1 미크로에서 매크로로
___다체계 모델(행위자 기반 모델)이란
___모델을 구성하는 요소
___시간과 공간의 이산화
___매크로적인 변수로 시스템의 움직임을 특징짓는다
___모델을 분석하는 방식
10.2 다양한 집단 현상 모델
___집단 모델
___동기 현상 모델
___인간의 행동과 의사결정 모델
10.3 상호작용 네트워크
___네트워크 구조를 통해 문제를 본다
___다른 노드와 얼마나 연결됐나
___유유상종?
___네트워크상에서 이동하기 쉬운 정도를 특징짓는다
___‘중심성’으로 중요한 노드를 특징짓는다
___‘친구의 친구’는 친구일까?
___무작위 네트워크를 만든다
___척도 없는 네트워크의 기본 모델
___컨피규레이션 모델

[04부] 수리 모델을 만든다

▣ 11장: 모델을 결정하기 위해 필요한 요소
11.1 수리 모델의 성질
___수리 모델을 만드는 목적
___모델링은 시행착오다
___결정론적 모델 vs. 확률 모델, 통계 모델
___이용할 수 있는 모델을 검토한다
11.2 이해 지향형 모델링의 요점
___이해하기 쉬운 모델이란
___간단한 모델이라고 해서 무엇이든 괜찮은 것은 아니다
___이해하려는 깊이와 모델링 기법
___수리 모델과 연역
___모델에 지정한 메커니즘의 수준보다 근원적인 내용은 설명할 수 없다
11.3 응용 지향형 모델링의 요점
___문제를 정의한다
___성능을 중시해서 모델을 선택한다
___데이터의 성질

▣ 12장: 모델을 결정하기 위해 필요한 요소
12.1 변수를 선택한다
___포함해야 할 변수, 포함하지 않는 변수
___변수의 해석성
___관계없는 변수는 제외한다
___특징량 엔지니어링
___이산값 변수와 연속값 변수
12.2 데이터 수집과 실험계획
___주목하는 변수의 영향을 제어하면서 데이터를 수집한다
___피셔의 삼원칙
___피셔의 삼원칙은 데이터의 치우침을 알아내는 힌트다
12.3 수리 구조와 매개변수 선택
___목적에 맞는 수리 구조를 선택한다
___목적변수의 분산을 무시할 수 없는 경우
___분산을 생각하지 않아도 되는 경우
___매개변수 값의 범위
12.4 모델링에 실패하지 않으려면
___기존 체계와의 일관성과 비교
___망치만 가진 사람에게는 모든 것이 못으로 보인다
___데이터에 적절한 전처리를 가한다

▣ 13장: 매개변수를 추정한다
13.1 목적에 맞는 매개변수 추정
___움직일 수 있는 매개변수와 움직일 수 없는 매개변수
___매개변수를 점추정한다
___변수의 움직임을 정량적으로 데이터에 맞추는 경우
___단순히 오차의 크기의 평균을 계산한다
___대수우도
___확률분포 사이의 ‘차이’를 최소화하는 지표
___교차 엔트로피
13.2 추정에서 목적함수를 최소화한다
___목적함수를 최소화하려면
___해석적으로 푼다
___매개변수를 스윕한다
___경사하강법
___국소해에 빠지지 않으려면
___과대적합을 피한다
___목적함수를 최소화한다
13.3 베이즈 추정과 베이즈 모델링
___베이즈 추정은 매개변수의 분포를 생각하는 것이다
___매개변수의 확률분포란?
___추정된 분포를 특징짓는다
___마르코프 연쇄 몬테카를로법
___메트로폴리스법

▣ 14장: 모델을 평가한다
14.1 ‘좋은 모델’이란
___목적에 맞는 모델을 평가한다
___메커니즘의 이해를 목적으로 한 모델 평가
___통계적 추론을 실행하기 위한 모델 평가
___응용 지향형 모델링에서 모델을 평가한다
14.2 분류 정확도를 측정하는 지표
___적합성과 성능을 측정한다
___정답률, 재현율, 특이도, 적합률, F값
___ROC 곡선과 AUC
14.3 정보량 규준
___모델이 복잡하면 적합도는 높아진다
___아카이케 정보량 규준(AIC)
___베이즈 정보량 규준 BIC
___그 밖의 정보량 규준
14.4 널 모델과 비교, 우도비 검정
___모델에 넣은 요소에 의미가 있는가
___우도비 검정
___통계검정과 널 모델
14.5 교차검증
___모델의 성능을 미지의 데이터로 테스트한다
___누수에 주의한다
___모델의 신빙성과 미지의 데이터


리뷰

구매자 별점

0.0

점수비율
  • 5
  • 4
  • 3
  • 2
  • 1

0명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

데이터 사이언스 시리즈


이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전