본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

수학으로 풀어보는 강화학습 원리와 알고리즘 상세페이지

수학으로 풀어보는 강화학습 원리와 알고리즘

데이터 사이언스 시리즈 073 | 딥러닝과 강화학습을 이해하기 위한 필수 수학 이론부터 다양한 강화학습 알고리즘, 모델 기반 강화학습까지

  • 관심 0
소장
종이책 정가
30,000원
전자책 정가
30%↓
21,000원
판매가
21,000원
출간 정보
  • 2023.02.01 전자책 출간
  • 2021.09.17 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 437 쪽
  • 10.0MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791158394127
ECN
-
수학으로 풀어보는 강화학습 원리와 알고리즘

작품 정보

코딩하면서 알고리즘이 유도된 과정이 궁금하다면 이 책을 선택하기 바랍니다!

이 책은 딥러닝이나 강화학습 예제를 코딩하면서 그 배경 알고리즘의 유도 과정을 궁금해하는 사람을 위한 책이다. 술술 읽히는 책은 아니지만, 그렇다고 심하게 어려운 책도 아니다. 수학의 선수 지식으로 대학 2학년 때 배우는 공업수학을 이수한 정도면 충분하고, 딥러닝의 선수 지식으로는 텐서플로 또는 파이토치를 사용하여 MNIST와 같은 간단한 딥러닝 예제를 따라해 본 정도면 충분하다.

이 책은 강화학습뿐만 아니라 다른 머신러닝과 딥러닝의 기초가 되는 확률이론과 추정론에 대한 기본적인 이해를 바탕으로 강화학습의 여러 알고리즘을 처음부터 끝까지 생략하지 않고 수식으로 유도했다.

강화학습이 추구하는 기본 목표로부터 A2C, A3C, PPO, DDPG, SAC 및 모델 기반 강화학습 등 강화학습의 알고리즘이 무엇이고 어떤 목적으로 개발됐는지, 어떻게 수학적으로 유도했는지, 그리고 어떻게 코드로 구현해 적용했는지를 구체적으로 설명한다.

★ 이 책에서 다루는 내용 ★

- 강화학습을 이해하기 위한 기본 수학: 확률론, 추정론, 최적화, 벡터/행렬의 미분
- 강화학습 알고리즘: A2C, A3C, PPO, DDPG, SAC
- 최적제어 알고리즘: 반복적 LQR, 가우시안 LQR
- 로컬 모델 기반 강화학습: GMM, 모델 피팅 방법, LQR을 이용한 강화학습

작가 소개

박성수
서울대학교 항공우주공학과에서 학사, 동 대학교 대학원에서 석사, 그리고 국비유학으로 미국 UC Berkeley에서 박사학위를 받았다. 유학가기 전에 국방과학연구소에서 연구원으로 일했으며, 박사후에는 UC Berkeley ITS 연구소에서 포스트닥 연구원으로 일했다. 현재 세종대학교 항공우주공학과 교수이며, 유도항법제어 및 AI for Dynamics and Control 분야를 연구하고 있다.

개인 블로그: https://pasus.tistory.com/

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

데이터 사이언스 시리즈더보기

  • PyTorch를 활용한 강화학습/심층강화학습 실전 입문 (오가와 유타로, 심효섭)
  • 실전 예제로 배우는 GAN (조시 칼린, 박진수)
  • 파이썬을 활용한 딥러닝 전이학습 (디파니안 사르카르, 러그허브 발리)
  • 실전! GAN 프로젝트 (카일라쉬 아히르와, 박진수)
  • 기초부터 시작하는 강화학습/신경망 알고리즘 (손민규)
  • 개정판 | 데이터 분석을 떠받치는 수학 (손민규)
  • 수학으로 풀어보는 칼만 필터 알고리즘 (박성수)
  • 데이터 분석을 위한 수리 모델 입문 (에자키 타카히로, 김범준)
  • 파이썬 데이터 클리닝 쿡북 (마이클 워커, 최용)
  • 머신러닝 시스템 디자인 패턴 (시부이 유우스케, 하승민)
  • 실전! 파이토치 딥러닝 프로젝트 (아쉬쉬 란잔 자, 김정인)
  • 개정판|텐서플로 2와 머신러닝으로 시작하는 자연어 처리 (전창욱, 최태균)
  • 파이썬 웹스크레이핑 완벽가이드 (최은석)
  • 모두를 위한 메타러닝 (정창훈, 이승현)
  • 개정판 | 파이썬 텍스트 마이닝 완벽 가이드 (박상언, 강주영)
  • 개정판 | 파이썬 데이터 사이언스 핸드북 (제이크 밴더플래스, 김정인)
  • 실전! 컴퓨터비전을 위한 머신러닝 (라이언 길라드, 마틴 괴르너)
  • 파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터비전 심층학습 (윤대희, 김동화)
  • 파이썬 텍스트 마이닝 바이블 [1권] (이상엽)
  • 파이썬 텍스트 마이닝 바이블 [2권] (이상엽)

개발/프로그래밍 베스트더보기

  • 객체지향 시스템 디자인 원칙 (마우리시오 아니체, 오현석)
  • AI 에이전트 인 액션 (마이클 래넘, 류광)
  • 코드 너머, 회사보다 오래 남을 개발자 (김상기, 배문교)
  • 개정2판 | 파인만의 컴퓨터 강의 (리처드 파인만, 서환수)
  • 주니어 백엔드 개발자가 반드시 알아야 할 실무 지식 (최범균)
  • 테디노트의 랭체인을 활용한 RAG 비법노트_기본편 (이경록(테디노트))
  • 시스템 설계 면접 완벽 가이드 (지용 탄, 나정호)
  • 멀티패러다임 프로그래밍 (유인동)
  • 생성형 AI를 위한 프롬프트 엔지니어링 (제임스 피닉스, 마이크 테일러)
  • 7가지 프로젝트로 배우는 LLM AI 에이전트 개발 (황자, 김진호)
  • 모던 소프트웨어 엔지니어링 (데이비드 팔리, 박재호)
  • Do it! LLM을 활용한 AI 에이전트 개발 입문 (이성용)
  • 개정판 | 밑바닥부터 시작하는 딥러닝 1 (사이토 고키, 이복연)
  • 개정2판 | 시작하세요! 도커/쿠버네티스 (용찬호)
  • 따라 하며 배우는 유니티 게임 개발 (아라카와 다쿠야, 아사노 유이치)
  • 실무에서 SQL을 다루는 기술 (마크 사이먼, 조은옥)
  • 핸즈온 생성형 AI (오마르 산세비에로, 페드로 쿠엥카)
  • LLM 인 프로덕션 (크리스토퍼 브루소, 매슈 샤프)
  • 이것이 스프링 부트다 with 자바 (김희선)
  • 핸즈온 LLM (제이 알아마르, 마르턴 흐루턴도르스트)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전