본문 바로가기

리디 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기

개정판 | 파이썬과 케라스로 배우는 강화학습 상세페이지

개정판 | 파이썬과 케라스로 배우는 강화학습

내 손으로 직접 구현하는 게임 인공지능

  • 관심 0
소장
종이책 정가
28,000원
전자책 정가
30%↓
19,600원
판매가
19,600원
출간 정보
  • 2021.06.02 전자책 출간
  • 2020.04.07 종이책 출간
듣기 기능
TTS(듣기) 지원
파일 정보
  • PDF
  • 380 쪽
  • 13.6MB
지원 환경
  • PC뷰어
  • PAPER
ISBN
9791158392635
ECN
-
개정판 | 파이썬과 케라스로 배우는 강화학습

작품 정보

강화학습의 기초부터 최근 알고리즘까지 친절하게 설명합니다!

‘알파고’로부터 받은 신선한 충격으로 많은 사람들이 강화학습에 관심을 가지기 시작했다. 하지만 처음 강화학습을 공부하는 분들을 위한 쉬운 자료나 강의를 찾아보기 어려웠다. 외국 강의를 통해 어렵게 이론을 공부하더라도 강화학습을 구현하는 데는 또 다른 장벽이 있었다. 이 책은 강화학습을 처음 공부하는 데 어려움을 겪는 독자를 위해 이론부터 코드 구현까지의 가이드를 제시한다.

특히 이번 개정판에서는 텐서플로 버전업에 맞춰서 코드를 업데이트하고 전반적인 이론 및 코드 설명을 개선했다. 그리고 실무에서 많이 활용될 수 있는 연속적 액터-크리틱 알고리즘을 추가했다.



★ 이 책에서 다루는 내용 ★

- 강화학습의 배경과 개념
- 강화학습의 기초 이론: MDP, 벨만 방정식, 다이내믹 프로그래밍
- 고전 강화학습 알고리즘: 몬테카를로, 살사, 큐러닝
- 인공신경망을 이용한 강화학습 알고리즘: 딥살사, REINFORCE, DQN, 액터-크리틱, A3C
- 강화학습 알고리즘 구현: 그리드월드, 카트폴, 아타리게임

작가 소개

이웅원
당근마켓에서 머신러닝 엔지니어 겸 프로덕트 매니저로서 재직 중이다. 그전에는 제이마플에서 딥러닝을 활용한 소리 인식기, 네이버에서 OCR을 연구했다. 머신러닝과 서비스가 맞닿은 지점에서 일하는 것을 즐긴다.

양혁렬
홍콩과학기술대학교 컴퓨터 공학과 석사과정에 재학 중이다. Visual Intelligence 랩에서 딥러닝을 이용한 오디오와 영상처리 연구를 진행 중이다.

김건우
뉴욕대학교 컴퓨터과학과를 졸업했다. 우버 라이드쉐어 마켓플레이스 팀에서 백엔드 엔지니어로 재직 중이다.


이영무
중앙대학교 컴퓨터공학과를 졸업했다. 현재는 당근마켓에서 머신러닝 엔지니어로 재직 중이며 추천을 비롯한 다양한 머신러닝 기술에 관심을 갖고 있다.

이의령
세종대학교 응용통계학을 졸업했다. 현재는 자동차 회사에서 머신러닝 엔지니어 업무를 하고 있다. 주로 자동차 R&D 과정에서 생성되는 이미지와 3D 데이터로 경험치를 쌓고 있다.

리뷰

5.0

구매자 별점
3명 평가

이 작품을 평가해 주세요!

건전한 리뷰 정착 및 양질의 리뷰를 위해 아래 해당하는 리뷰는 비공개 조치될 수 있음을 안내드립니다.
  1. 타인에게 불쾌감을 주는 욕설
  2. 비속어나 타인을 비방하는 내용
  3. 특정 종교, 민족, 계층을 비방하는 내용
  4. 해당 작품의 줄거리나 리디 서비스 이용과 관련이 없는 내용
  5. 의미를 알 수 없는 내용
  6. 광고 및 반복적인 글을 게시하여 서비스 품질을 떨어트리는 내용
  7. 저작권상 문제의 소지가 있는 내용
  8. 다른 리뷰에 대한 반박이나 논쟁을 유발하는 내용
* 결말을 예상할 수 있는 리뷰는 자제하여 주시기 바랍니다.
이 외에도 건전한 리뷰 문화 형성을 위한 운영 목적과 취지에 맞지 않는 내용은 담당자에 의해 리뷰가 비공개 처리가 될 수 있습니다.
아직 등록된 리뷰가 없습니다.
첫 번째 리뷰를 남겨주세요!
'구매자' 표시는 유료 작품 결제 후 다운로드하거나 리디셀렉트 작품을 다운로드 한 경우에만 표시됩니다.
무료 작품 (프로모션 등으로 무료로 전환된 작품 포함)
'구매자'로 표시되지 않습니다.
시리즈 내 무료 작품
'구매자'로 표시되지 않습니다. 하지만 같은 시리즈의 유료 작품을 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
작품을 영구 삭제해도 '구매자' 표시는 남아있습니다.
결제 취소
'구매자' 표시가 자동으로 사라집니다.

개발/프로그래밍 베스트더보기

  • 도커로 구축한 랩에서 혼자 실습하며 배우는 네트워크 프로토콜 입문 (미야타 히로시, 이민성)
  • LLM과 RAG로 구현하는 AI 애플리케이션 (에디유, 대니얼김)
  • 핸즈온 LLM (제이 알아마르, 마르턴 흐루턴도르스트)
  • AI 에이전트 인 액션 (마이클 래넘, 류광)
  • 테디노트의 랭체인을 활용한 RAG 비법노트_기본편 (이경록(테디노트))
  • AI 에이전트 생태계 (이주환)
  • 생성형 AI 인 액션 (아미트 바리, 이준)
  • 테디노트의 랭체인을 활용한 RAG 비법노트 심화편 (이경록)
  • 이게 되네? 클로드 MCP 미친 활용법 27제 (박현규)
  • 아키텍트 첫걸음 (요네쿠보 다케시, 조다롱)
  • 지속적 배포 (발렌티나 세르빌, 이일웅)
  • 개정2판 | 파인만의 컴퓨터 강의 (리처드 파인만, 서환수)
  • 시스템 설계 면접 완벽 가이드 (지용 탄, 나정호)
  • 생성형 AI를 위한 프롬프트 엔지니어링 (제임스 피닉스, 마이크 테일러)
  • LLM을 활용한 실전 AI 애플리케이션 개발 (허정준, 정진호)
  • 개정판 | 전문가를 위한 C++ (5판) (마크 그레고리, 남기혁)
  • 코딩 자율학습 리액트 프런트엔드 개발 입문 (김기수)
  • Do it! LLM을 활용한 AI 에이전트 개발 입문 (이성용)
  • 개정판 | Do it! HTML+CSS+자바스크립트 웹 표준의 정석 (고경희)
  • 개발자가 영어도 잘해야 하나요? (최희철)

본문 끝 최상단으로 돌아가기

spinner
앱으로 연결해서 다운로드하시겠습니까?
닫기 버튼
대여한 작품은 다운로드 시점부터 대여가 시작됩니다.
앱으로 연결해서 보시겠습니까?
닫기 버튼
앱이 설치되어 있지 않으면 앱 다운로드로 자동 연결됩니다.
모바일 버전