- 강화 학습의 기본 원리와 동작을 이해할 수 있다.
- 강화 학습과 관련된 수학적 이론 및 용어를 구분할 수 있다.
- 강화 학습에 사용되는 기본 알고리즘을 이해할 수 있다.
- 강화 학습 & 딥강화학습 구현 코드를 분석하고 활용할 수 있다.
훈련대상
가. AI 제품 기획/설계/기술지원/테스팅/감리/컨설팅 관련 자
나. 강화학습 & 딥강화학습의 원리와 핵심 알고리즘을 파악하고자 하는 자
다. 강화학습 & 딥강화학습 모델을 구현하고자 하는 개발자
* 사전지식 : 파이썬 프로그래밍, 머신러닝/딥러닝 기본 지식, 딥러닝 CNN 모델 구현
교육시간
21시간
커리큘럼
1일차
가. 강화학습 기초
- 실습 환경 구축하기
- 강화학습 개념 이해하기
- MDP (Markov Decision Process) 이해하기
- 벨만(Bellman) 방정식 이해하기
나. Dynamic 프로그래밍과 강화 학습
- Grid World와 Dynamic Programming 구현하기
- Dynamic Programming 1 - 정책 이터레이션 구현하기
- Dynamic Programming 2 - 가치 이터레이션 구현하기
2일차
다. 강화학습 알고리즘 살사와 큐러닝
- 몬테 카를로 예측과 시간차 예측 이해 및 구현하기
- 강화 학습 알고리즘 살사 (SARSA) 이해 및 구현하기
- 강화 학습 알고리즘 큐러닝 (Q-Laerning) 이해 및 구현하기
라. 인공신경망을 결합한 딥강화학습 구현
- Value Function Approximation 이해하기
- 인공신경망을 결합한 강화학습 Deep Q-Networks 구현하기
- 인공신경망을 결합한 강화학습 Policy Gradient 구현하기
3일차
마. 딥강화학습 DQN 구현
- 딥강화학습 DQN 구현 1 - 카트폴 구현하기
- 딥강화학습 DQN 구현 2 - 아타리 게임 구현하기
바. 딥강화학습 Actor-Critic 구
- 딥강화학습 Actor-Critic(A2C) 구현 1 - 카트폴 구현하기
- 딥강화학습 Actor-Critic(A3C) 구현 2 - 아타리 게임 구현하기