Reinforcement Learning: An Introduction - 강화 학습, Q-러닝, 정책 경량화, 가치 함수, 탐색, 활용, 딥러닝, 마르코프 결정 과정, 보상, 에이전트, 환경, 신경망, 모델 기반 학습, 샘플 효 글자 크기 작게 글자 크기 크게 목차 이전 다음 page 1/