Python과 Tensorflow를 활용한 강화학습의 이해와 활용

주제

데이터사이언스 - AI

강사명

김수현

교육목표

강화 학습의 기본 원리와 동작을 이해할 수 있다. 강화 학습과 관련된 수학적 이론 및 용어를 구분할 수 있다. 강화 학습에 사용되는 기본 알고리즘을 이해할 수 있다. 강화 학습 구현 코드를 분석하고 활용할 수 있다. Tensorflow와 Keras 등을 이용하여 강화 학습에 사용되는 기본 알고리즘을 구현할 수 있다."

교육시간

3일 21시간

커리큘럼

가. 강화학습 기초 - 실습 환경 구축하기 - 강화학습 개념 이해하기 - MDP (Markov Decision Process) 이해하기 - 벨만(Bellman) 방정식 이해하기 나. Dynamic 프로그래밍과 강화 학습 - Grid World와 Dynamic Programming 구현하기 - Dynamic Programming 1 - 정책 이터레이션 구현하기 - Dynamic Programming 2 - 가치 이터레이션 구현하기 다. 강화학습 알고리즘 살사와 큐러닝 - 몬테 카를로 예측과 시간차 예측 이해 및 구현하기 - 강화 학습 알고리즘 살사 (SARSA) 이해 및 구현하기 - 강화 학습 알고리즘 큐러닝 (Q-Laerning) 이해 및 구현하기 라. 강화학습과 인공신경망 - Value Function Approximation 이해하기 - 인공신경망을 결합한 강화학습 Deep Q-Networks 구현하기 - 인공신경망을 결합한 강화학습 Policy Gradient 구현하기 마. 강화학습 DQN 구현 사례 - 강화학습 DQN 구현 사례 1 - 카트폴 구현하기 - 강화학습 DQN 구현 사례 2 - 아타리 게임 구현하기 바. 강화학습 Actor-Critic 구현 사례 - 강화학습 Actor-Critic(A2C) 구현 사례 1 - 카트폴 구현하기 - 강화학습 Actor-Critic(A3C) 구현 사례 2 - 아타리 게임 구현하기

수강신청 방법

아래 일정 기입된 부분 두 번 클릭 시 수강신청 사이트로 이동

14 more properties