본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

강화학습 기본과 PyTorch 상세페이지

강화학습 기본과 PyTorch

강화학습 시리즈 1

  • 관심 0
소장
종이책 정가
22,000원
전자책 정가
22,000원
판매가
22,000원
출간 정보
  • 2024.02.08 전자책 출간
  • 2024.02.10 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 265 쪽
  • 9.5MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791158085834
UCI
-
강화학습 기본과 PyTorch

작품 정보

신경망 공부를 하다 보면, ‘학습은 비지도 학습, 지도 학습, 그리고 강화학습으로 나뉜다. 알파고와 자율 주행차에서 사용하는 강화학습, 아이가 세상과 상호작용하면서 세상을 배우는 과정을 모방한 강화학습.’ 등과 같은 문장을 접하게 된다. 그러면서 다음과 같은 생각이 든다.

‘강화학습을 공부해 볼까?’

그러나 이 영역으로 들어가기가 쉽지 않다: (1) 기존 신경망 학습 구조와 완전히 다르고, (2) 매우 많은 강화학습 방법을 어떤 순서로 공부해야 하는지 알기 어렵고, (3) 강화학습을 개념부터 코딩까지 분명하게 이해할 수 있도록 안내해 주는 저서를 찾아보기 어렵기 때문이다.

이런 문제를 해결할 수 있는 안내서를 만드는 것이 본 저서의 목적이다: (1) 비지도 학습과 지도 학습에 없는 환경과 에이전트를 먼저 이해해야 한다. 이것이 강화학습의 첫걸음이다(1장). 여러 예제를 통해 그림만으로 환경과 에이전트를 이해하고 이를 수식으로 표현하는 연습이 되어야, 행동을 잘 선택해서 현재와 미래에 받을 보상의 총합을 최대로 만드는 과정을 이해할 수 있다. (2) 아래 표와 같이 환경을 알 때의 강화학습은 1~4장에서 다루고 모를 때는 5~11장에서 다룬다. 신경망 사용 여부를 기준으로 하면, 1~6장에서는 사용하지 않고 7~11장에서는 사용한다.

제1장부터 4장까지가 강화학습 공부의 기반이므로 여기서 흔들리면 앞으로 나아가기 어렵다. 특히, 2장의 벨만 방정식을 이용한 계산 문제를 생략하지 말고 연습해야 한다. 환경을 모를 때 일반적으로 신경망을 사용하지만, 5~6장에서는 신경망을 사용하지 않는 강화학습을 다룬다. 제7장부터 신경망을 사용한 강화학습을 공부하게 된다. 이때 2장에서 공부한 벨만 방정식을 따라 신경망의 손실을 정의하게 된다. (3) 개념 이해는 그림에서 시작해야 하고, 이를 코딩까지 이어가야 한다는 원칙으로 본 저서를 집필했다. 특히 구현하려는 코드를 그림으로 그린다는 생각으로 그림을 만들었다.

좋은 책을 만들기 위해 최선을 다했지만 오류가 나올 수 있다. 이 점은 양해를 바라며, 출간 후 나올 수 있는 수정사항이나 참고자료 등은 자유아카데미 홈페이지 자료실(www.freeaca.com)을 통해 게시할 것이니 참고하기를 바란다. 본 저서는 강화학습의 기본 이론에서 시작해서 깊은 Q-네트워크(Deep Q? Network , DQN)의 일부분까지 기술하고 있으며, 여기서 다루지 못한 내용은 앞으로 강화학습 시리즈를 통해 다룰 예정이다.

작가 프로필

추상목
작가 프로필 수정 요청
작가의 대표 작품더보기
  • 강화학습 기본 다지기와 PyTorch (추상목)
  • 강화학습 기본과 PyTorch (추상목)

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

강화학습 시리즈더보기

  • 강화학습 기본 다지기와 PyTorch (추상목)

교재/수험서 베스트더보기

  • 2026 시나공 정보처리 기사 필기 기본서 (길벗 R&D)
  • 2026 축산기사·산업기사 필기실기(2026 개정 출제기준) (안제국(축산기술사))
  • 2026 어문회 한자능력검정시험 2급 한 권으로 끝내기 (박원길, 박정서)
  • 한양 한국어 1-1 (한양대학교 국제교육원)
  • 2026 시대에듀 행정사 1차 전과목 한권으로 끝내기 (박종화, 시대법학연구소)
  • 2025 시대에듀 빅데이터분석기사 필기 한권으로 끝내기 (정혜정, 장희선)
  • New 서강한국어 1A Student's Book (영어판) (서강대학교 한국어교육원)
  • 2026 시대에듀 유선배 정보통신기사 필기 합격노트 (변세현(수.재.비), 손대호)
  • 2026 9급 계리직 공무원 우편일반 단원별 예상문제집 (하종화)
  • 2026 최신판 시대에듀 NCS 수리능력 합격노트 (SDC)
  • 2026 시대에듀 Win-Q 공조냉동기계산업기사 필기 단기합격 (안준기)
  • 2026 시대에듀 Win-Q 설비보전산업기사 필기+실기 단기합격 (박창학)
  • 2026 시대에듀 행정사 2차 전과목 논술·약술 한권으로 끝내기 (이성재, 시대법학연구소)
  • 2026 행정사 민법 요약서 마이 민법 총칙 (김묘엽)
  • 2026 단끝 택시운전 자격시험 CBT 기출복원문제집+무료특강-서울·경기·인천 (윤정현, 정한진)
  • 법학적성시험 문제 해설: 추리논증 Ⅰ (2026-2022학년도) (법학전문대학원협의회)
  • 2026년 대비 9급 행정학 (핵심정리) (반달문)
  • 어문회 한자능력검정시험 4급 한 권으로 끝내기 (박정서, 박원길)
  • 2026 더플러스 에너지관리기사 기출문제집 필기(에너지아카데미의) (에너지아카데미(이상식))
  • 드론 지도조종자 교관과정 핵심정리 및 기출유형문제(2026년판) (홍석길)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전