강화 학습 환경 설계의 이론과 실제 - 강화 학습, 환경 설계, 에이전트, 보상, 상태, 행동, 탐험, 활용, 마르코프 결정 과정, 정책, 가치 함수, 시뮬레이션, 최적화, 실험, 데이터 수집, 피드백, 학습률, 수렴, 모델 기반 글자 크기 작게 글자 크기 크게 목차 이전 다음 page 1/