본문 바로가기

리디북스 접속이 원활하지 않습니다.
강제 새로 고침(Ctrl + F5)이나 브라우저 캐시 삭제를 진행해주세요.
계속해서 문제가 발생한다면 리디북스 접속 테스트를 통해 원인을 파악하고 대응 방법을 안내드리겠습니다.
테스트 페이지로 이동하기


Do it! 강화 학습 입문 : GPT-2부터 자동 신경망 구성까지 상세페이지

컴퓨터/IT 개발/프로그래밍

Do it! 강화 학습 입문 : GPT-2부터 자동 신경망 구성까지

구매종이책 정가15,000
전자책 정가15,000
판매가15,000
Do it! 강화 학습 입문 : GPT-2부터 자동 신경망 구성까지

작품 소개

<Do it! 강화 학습 입문 : GPT-2부터 자동 신경망 구성까지> 이론과 실습을 한 번에 잡는 강화 학습 입문서!
파이썬으로 블랙잭 게임 봇 만들기부터 NAS로 자동 신경망 구성까지 Do it!
알파고, 테슬라 오토 파일럿, 스타크래프트2 자동 플레이 봇은 어떻게 만들었을까? 궁금하다면 강화 학습을 공부하자. 영화 <엣지 오브 투모로우>의 이야기로 쉽게 시작하는 강화 학습! 이 책 한 권이면 이론 공부는 물론이고 다양한 실습으로 강화 학습의 실체를 빠르게 파헤쳐 볼 수 있다. 블랙잭, 비행기 게임, 공 균형 유지 게임 봇, GPT-2 질의응답을 해주는 꼬맹이 자비스, 분산 강화 학습, NAS 자동 신경망 생성기 등을 만들면서 강화 학습을 피부로 느껴 보자!

※ 이 책은 PDF 북이므로 화면이 작은 단말기(스마트폰)에서는 보기 불편합니다. ※


출판사 서평

이런 사람이 읽으면 좋아요
- 머신러닝·딥러닝 공부를 하면서 들은 ‘강화 학습’이 무엇인지 궁금해진 사람
- 알파고의 핵심 기술인 ‘강화 학습’을 다양한 실습으로 공부해 보고 싶은 사람
- 에저 분산 강화 학습, AWS 자율 주행 딥레이서 등 강화 학습 상용 서비스를 직접 사용하고 싶은 사람
- 강화 학습의 이론·실습 공부를 한 번에 끝내고 싶은 사람

이런 강화 학습 기술을 경험하고 배울 수 있어요
- 파이썬으로 블랙잭 봇 만들기
- OpenAI 짐 레트로로 2D 게임(비행기 게임)을 자동 플레이하는 에이전트 만들기
- UnityML로 3D 게임(공 균형 유지하기 게임)을 자동 플레이하는 에이전트 만들기
- AWS 딥레이서에서 자율 주행 에이전트 만들기
- MS 에저에서 분산 강화 학습 실습하기
- NAS로 자동 신경망 구성 실습하기

블랙잭 봇부터 자동 신경망 구성까지 실제 동작하는 강화 학습 에이전트 만들기
강화 학습으로 만든 알파고! 강화 학습은 대체 무엇이고 어떤 원리로 동작할까? 직접 만들고 실행하면서 공부하다 보면 강화 학습을 쉽게 이해할 수 있다! 나보다 게임을 더 잘하는 블랙잭, 2D·3D 게임 플레이 봇, 내가 정한 규칙에 맞게 트랙을 달리는 자율 주행 AWS 딥레이서, 내가 하는 질문에 척척 대답하는 GPT-2 꼬맹이 자비스, 신경망을 자동으로 만들어 주는 NAS까지! 책 한 권으로 강화 학습 공부를 끝내 보자!

마르코프 결정 과정, 몬테카를로 학습, PPO 알고리즘 등 강화 학습 이론 소개
강화 학습의 이론 공부도 빼놓을 수 없다! 영화 <엣지 오브 투모로우>로 마르코프 결정 과정이 무엇인지 이해하는 것으로 시작하여 블랙잭 봇을 만들며 몬테카를로 학습을 배우고, 게임 봇이나 아마존 딥레이서에 적용하는 PPO 알고리즘 등 ‘강화 학습에 입문하려면 꼭 알아야 하는 알고리즘’을 수식과 함께 소개했다.

AWS 딥레이서, MS 에저 분산 강화 학습 등 상용 서비스 활용 방법 수록
강화 학습을 현실에 적용할 수 있는지 알고 싶다면 상용 서비스를 직접 사용해 보면 된다! AWS 딥레이서 서비스로 자율 주행 자동차를 만들어 전 세계 사용자와 대결해 보고, MS 에저 분산 강화 학습을 실습하여 실제 강화 학습을 효과적으로 할 수 있는 분산 시스템도 경험해 본다!

이지스퍼블리싱이 선사하는 독자 지원
· 본문 소스 100% 무료 제공
- 깃허브: https://github.com/yunho0130/start-RL

· 이 책의 독자들과 함께 공부하고 책 선물도 받아 가세요!
- 두잇 스터디룸(책 내용 관련 질문 환영): cafe.naver.com/doitstudyroom


저자 프로필

조규남

  • 학력 고려대학교 대학원 슈퍼 컴퓨팅 활용 대규모 계산 연구 석사
  • 경력 국내 IT 대기업에서 AI를 위한 대규모 GPU 시스템의 개발과 운영 중

2021.06.04. 업데이트 작가 프로필 수정 요청

삼성전자 소프트웨어 멤버십을 시작으로 현재 국내 IT 대기업에서 AI를 위한 대규모 GPU 시스템의 개발과 운영을 맡고 있습니다. 고려대학교 대학원에서 슈퍼 컴퓨팅을 활용한 대규모 계산 연구로 석사 학위를 받았습니다. 대규모 GPU를 기반으로 한 AI 시스템과 다양한 컴퓨팅 기술 트렌드에 관심이 많습니다. 국내 다양한 컨퍼런스에서 관련 내용을 발표했습니다.


저자 소개

조규남
삼성전자 소프트웨어 멤버십을 시작으로 현재 국내 IT 대기업에서 AI를 위한 대규모 GPU 시스템의 개발과 운영을 맡고 있습니다. 고려대학교 대학원에서 슈퍼 컴퓨팅을 활용한 대규모 계산 연구로 석사 학위를 받았습니다. 대규모 GPU를 기반으로 한 AI 시스템과 다양한 컴퓨팅 기술 트렌드에 관심이 많습니다. 국내 다양한 컨퍼런스에서 관련 내용을 발표했습니다.

맹윤호
현재 외국계 글로벌 IT 기업의 Data & AI 부서에서 엔지니어로 근무하고 있습니다. 연세대학교에서 데이터 분석 전공으로 석사 과정을 졸업하고 박사 과정을 수료했습니다. 삼성, 현대, LG, 딜로이트 등의 기업과 연세대학교, 중앙대학교, 상명대학교, 순천대학교 등에서도 강연한 바 있습니다.

임지순
여러 IT 기업에서 기술 에반젤리스트 역할을 수행하고 있습니다. KAIST 바이오 및 뇌공학과에서 신경공학으로 석사 과정을 졸업했습니다.

목차

_01장 강화 학습이란?
__01-1 강화 학습 멀리서 훑어보기
__01-2 마르코프 결정 과정으로 시작하는 강화 학습
__01-3 모델 프리 강화 학습

_02장 강화 학습에 딥러닝 조합하기
__02-1 딥러닝 쾌속 복습!
__02-2 DQN 공부하기

_03장 알파고 도전을 위한 첫걸음
__03-1 게임을 스스로 플레이하는 에이전트 만들기
__03-2 유니티 엔진으로 에이전트 만들기

_04장 딥레이서로 구현하는 자율 주행
__04-1 PPO 알고리즘 알아보기
__04-2 딥레이서로 공부하는 강화 학습

_05장 영화 <아이언맨>의 자비스 만들기
__05-1 자연어 처리가 뭐죠?
__05-2 자연어 처리 기법 알아보기
__05-3 GPT로 알아보는 자연어 처리와 강화 학습
__05-4 GPT-2로 자비스 만들기
__05-5 GPT-3와 강화 학습의 미래

_06장 분산 강화 학습 공부하기
__06-1 분산 학습 기초 공부하기
__06-2 분산 강화 학습을 위한 RLlib 라이브러리
__06-3 분산 강화 학습 실행해 보기

_07장 강화 학습으로 만드는 신경망 구조
__07-1 NAS란 무엇일까?
__07-2 NAS 흐름 알아보기
__07-3 NAS 직접 사용해 보기

_08장 NAS 더 자세히 알아보기
__08-1 NAS를 만드는 3단계 다시 알아보기
__08-2 탐색 전략 알아보기
__08-3 탐색 공간 알아보기
__08-4 성능 평가 전략 알아보기
__08-5 NAS, NASNet, ENAS 요약하기


리뷰

구매자 별점

0.0

점수비율

  • 5
  • 4
  • 3
  • 2
  • 1

0명이 평가함

리뷰 작성 영역

이 책을 평가해주세요!

내가 남긴 별점 0.0

별로예요

그저 그래요

보통이에요

좋아요

최고예요

별점 취소

구매자 표시 기준은 무엇인가요?

'구매자' 표시는 리디북스에서 유료도서 결제 후 다운로드 하시거나 리디셀렉트 도서를 다운로드하신 경우에만 표시됩니다.

무료 도서 (프로모션 등으로 무료로 전환된 도서 포함)
'구매자'로 표시되지 않습니다.
시리즈 도서 내 무료 도서
'구매자’로 표시되지 않습니다. 하지만 같은 시리즈의 유료 도서를 결제한 뒤 리뷰를 수정하거나 재등록하면 '구매자'로 표시됩니다.
영구 삭제
도서를 영구 삭제해도 ‘구매자’ 표시는 남아있습니다.
결제 취소
‘구매자’ 표시가 자동으로 사라집니다.

이 책과 함께 구매한 책


이 책과 함께 둘러본 책



본문 끝 최상단으로 돌아가기

spinner
모바일 버전