|
일반
모바일
탄탄한 강화학습 개념잡기
수강신청 |
||
[강의목차]
01. 강화학습의 배경과 특성
02. 강화학습 인터페이스 03. Exploitation과 Exploration 04. 강화학습 문제정의_MDP와 Policy 05. 강화학습 문제정의_가치함수 06. 강화학습 문제정의_최적 가치함수 07. 강화학습 솔루션_Dynamic Programming 08. 강화학습 솔루션_Monte Carlo 방법 09. 강화학습 솔루션_Temporal Difference 방법 10. 강화학습 솔루션_n-step Bootstrapping 11. 강화학습 솔루션_가치함수 근사화 12. 강화학습 솔루션_가치함수 근사화 솔루션 13. 강화학습 솔루션_Eligibility Traces 14. 강화학습 솔루션_Policy Gradient 방법 15. 강화학습 솔루션_REINFORCE와 Actor-Critic 방법 |
[평가기준]
|
[강사소개]
|
[수강후기]
☆☆☆☆☆0
총 0건의 수강후기
|