본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

파이토치로 완성하는 실전 강화학습 상세페이지

파이토치로 완성하는 실전 강화학습

REINFORCE, A2C, DQN, DDQN, PPO, A3C 이론과 구현을 한번에!

  • 관심 0
소장
종이책 정가
46,000원
전자책 정가
20%↓
36,800원
판매가
36,800원
출간 정보
  • 2025.10.30 전자책 출간
  • 2025.08.28 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 766 쪽
  • 35.0MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791194409441
UCI
-
파이토치로 완성하는 실전 강화학습

작품 정보

강화학습의 기초부터 고급 주제까지 단계적이고 체계적으로 다루는 책이다. 정책 기반 알고리즘(REINFORCE, PPO)과 액터–크리틱(A2C, A3C), 가치 기반(DQN, DDQN) 기법을 이론과 실습의 균형을 맞춰 설명하며, 개념을 시각화하고 수식을 단계별로 풀어 설명하는 한편 배경 지식을 이해하는 데 도움이 되는 팁을 제공한다. 독자는 알고리즘의 핵심 코드를 직접 구현해 보고 바로 정답을 확인해 볼 수 있고, 강화학습 프레임워크를 설계해 이를 기반으로 다양한 알고리즘을 적용해 보면서 전체 프로세스를 체계적으로 익히게 된다. 또한 각 구성 요소를 깊이 이해한 뒤에는 스스로 알고리즘을 개선·확장할 수 있도록 안내하며, 분산 학습과 같은 최신 기법까지 포함해 실제 실무 환경에 곧바로 적용할 수 있는 실전 지식을 제공한다.

작가 소개

KAIST 전산학과에서 컴퓨터 그래픽스를 전공했으며 LG전자 전자기술원, 티맥스소프트, 액센츄어 등에서 소프트웨어 연구 개발, 미들웨어 및 모듈형 로봇 플랫폼 제품 기획 업무를 수행했다. 인공지능 전문가로서 한국외국어대학교에서 딥러닝, 자료 구조, 데이터 마이닝을 가르치고, ㈜인공지능연구원에서 연구개발을 총괄했다.
현재는 SoftAI의 연구소장으로서 AI 솔루션 연구 개발을 하고 있으며 서울과학종합 대학원대학교 AI첨단대학원 겸직 교수를 역임하고 있다. 대표 저서에는 『Do it! 딥러닝 교과서』(이지스퍼블리싱, 2021), 『파이썬으로 구현하는 로보어드바이저』(에이콘, 2024), 『모두를 위한 컨벡스 최적화』(오픈소스, 2018)가 있다.

리뷰

0.0

구매자 별점
0명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

컴퓨터/앱 활용 베스트더보기

  • 요즘 당근 AI 개발 (당근 팀)
  • AI 2026 트렌드&활용백과 (김덕진)
  • 일 잘하는 사람은 이렇게 챗GPT를 씁니다 (장피엠(장병준))
  • 요즘 바이브 코딩 클로드 코드 완벽 가이드 (최지호(코드팩토리))
  • 픽셀 아트 마스터 컬렉션 (니치보출판사)
  • AI 잘 쓰는 디자이너 (전하린 )
  • [50년 대여] 노스탤지어 너드의 레트로 하드웨어 (피터 리, 김근태)
  • 한 권으로 끝내는 올인원 피그마 (오시내)
  • 블렌더 3D CG 애니메이션 실전 입문 (나츠모리 카츠)
  • 이게 되네? 제미나이 노트북LM 미친 활용법 51제 (오힘찬)
  • 실전에서 바로 써먹는 업무자동화 (남동득)
  • 된다! 하루 만에 끝내는 제미나이 활용법 (권서림)
  • 진짜 쓰는 실무 엑셀 (전진권)
  • 아이패드 인물 드로잉 (서미리)
  • 눈치껏 못 배웁니다, 일센스 (공여사들)
  • 리액트 잘하는 개발자 되기 (성낙현)
  • 컴퓨터 아키텍처 (찰스 폭스, 류광)
  • 개발자는 글을 못 쓴다고요? (전정은, 황수정)
  • 일잘러의 무기가 되는 엑셀 대시보드 (최준선)
  • 글 1개로 1년 치 피드를 채우는 무한 콘텐츠 증식 시스템 (에디터 C)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전