본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

강화학습 기본과 PyTorch 상세페이지

강화학습 기본과 PyTorch

강화학습 시리즈 1

  • 관심 0
소장
종이책 정가
22,000원
전자책 정가
22,000원
판매가
22,000원
출간 정보
  • 2024.02.08 전자책 출간
  • 2024.02.10 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 265 쪽
  • 9.5MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791158085834
UCI
-
강화학습 기본과 PyTorch

작품 정보

신경망 공부를 하다 보면, ‘학습은 비지도 학습, 지도 학습, 그리고 강화학습으로 나뉜다. 알파고와 자율 주행차에서 사용하는 강화학습, 아이가 세상과 상호작용하면서 세상을 배우는 과정을 모방한 강화학습.’ 등과 같은 문장을 접하게 된다. 그러면서 다음과 같은 생각이 든다.

‘강화학습을 공부해 볼까?’

그러나 이 영역으로 들어가기가 쉽지 않다: (1) 기존 신경망 학습 구조와 완전히 다르고, (2) 매우 많은 강화학습 방법을 어떤 순서로 공부해야 하는지 알기 어렵고, (3) 강화학습을 개념부터 코딩까지 분명하게 이해할 수 있도록 안내해 주는 저서를 찾아보기 어렵기 때문이다.

이런 문제를 해결할 수 있는 안내서를 만드는 것이 본 저서의 목적이다: (1) 비지도 학습과 지도 학습에 없는 환경과 에이전트를 먼저 이해해야 한다. 이것이 강화학습의 첫걸음이다(1장). 여러 예제를 통해 그림만으로 환경과 에이전트를 이해하고 이를 수식으로 표현하는 연습이 되어야, 행동을 잘 선택해서 현재와 미래에 받을 보상의 총합을 최대로 만드는 과정을 이해할 수 있다. (2) 아래 표와 같이 환경을 알 때의 강화학습은 1~4장에서 다루고 모를 때는 5~11장에서 다룬다. 신경망 사용 여부를 기준으로 하면, 1~6장에서는 사용하지 않고 7~11장에서는 사용한다.

제1장부터 4장까지가 강화학습 공부의 기반이므로 여기서 흔들리면 앞으로 나아가기 어렵다. 특히, 2장의 벨만 방정식을 이용한 계산 문제를 생략하지 말고 연습해야 한다. 환경을 모를 때 일반적으로 신경망을 사용하지만, 5~6장에서는 신경망을 사용하지 않는 강화학습을 다룬다. 제7장부터 신경망을 사용한 강화학습을 공부하게 된다. 이때 2장에서 공부한 벨만 방정식을 따라 신경망의 손실을 정의하게 된다. (3) 개념 이해는 그림에서 시작해야 하고, 이를 코딩까지 이어가야 한다는 원칙으로 본 저서를 집필했다. 특히 구현하려는 코드를 그림으로 그린다는 생각으로 그림을 만들었다.

좋은 책을 만들기 위해 최선을 다했지만 오류가 나올 수 있다. 이 점은 양해를 바라며, 출간 후 나올 수 있는 수정사항이나 참고자료 등은 자유아카데미 홈페이지 자료실(www.freeaca.com)을 통해 게시할 것이니 참고하기를 바란다. 본 저서는 강화학습의 기본 이론에서 시작해서 깊은 Q-네트워크(Deep Q? Network , DQN)의 일부분까지 기술하고 있으며, 여기서 다루지 못한 내용은 앞으로 강화학습 시리즈를 통해 다룰 예정이다.

작가 프로필

추상목
작가 프로필 수정 요청
작가의 대표 작품더보기
  • 강화학습 기본 완성과 PyTorch (추상목)
  • 강화학습 기본 다지기와 PyTorch (추상목)
  • 강화학습 기본과 PyTorch (추상목)

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

강화학습 시리즈더보기

  • 강화학습 기본 다지기와 PyTorch (추상목)
  • 강화학습 기본 완성과 PyTorch (추상목)

교재/수험서 베스트더보기

  • 2026 시대에듀 빅데이터분석기사 필기 한권으로 끝내기 (정혜정, 장희선)
  • 법학적성시험 문제 해설: LEET 언어이해 Ⅱ (2021-2016학년도) (법학전문대학원협의회)
  • 2026 변민재 교육학 핵인싸 핵심 INSIDE+별책 (변민재)
  • 서강한국어 Student's Book 1A (영어판) 3rd edition (서강대학교 한국어교육원)
  • 한양 한국어 1-1 (한양대학교 국제교육원)
  • 개정판 | 네트워크 해킹과 보안 (양대일, 홍성혁)
  • 2026 시나공 정보처리 기사 필기 기본서 (길벗 R&D)
  • 2026 시대에듀 화재감식평가기사·산업기사 실기 필답형 (문옥섭, 박정주)
  • 2026 시대에듀 임상심리사 2급 2차 실기합격 단기완성 한권으로 끝내기 (이용석)
  • 2026 시대에듀 경찰공무원(순경) 공채 대비 전과목 FINAL 모의고사 (시대경찰시험연구소)
  • 2026 시대에듀 직업상담사 2급 2차 실기 직업상담실무 이론서 (직업상담연구소)
  • 2026 최신판 시대에듀 한국공항공사 통합기본서 (SDC)
  • 2026 박문각 공무원 진가영 영어 진족보 마무리 합격노트 (진가영)
  • 2026 최신간 기분좋은 KFI 한국식품정보원이 집필한 식품안전기사 필기 요약이론+기출문제+ 파이널 (#요기파) (한국식품정보원, 박현수)
  • 2026 시대에듀 유선배 SQL개발자(SQLD) 합격노트 (정미나)
  • 워드 시프트 (최정숙)
  • 디지털증거법 (이관희)
  • 해커스 한국사능력검정시험 심화(1·2·3급) 시대별 기출문제집 (해커스 한국사연구소)
  • 보이는 통계학 with 파이썬 (손원)
  • 2026 시대에듀 검색광고마케터 1급 7일 단기완성 (시대마케팅연구소)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전