Reinforcement Learning: An Introduction - 강화 학습, Q-러닝, 정책 경량화, 가치 함수, 탐색, 활용, 딥러닝, 마르코프 결정 과정, 보상, 에이전트, 환경, 신경망, 모델 기반 학습, 샘플 효 미리보기