본문 영역으로 바로가기
알림창
인천무크(i-MOOC) 회원가입
1. 아래 버튼을 클릭해 Office 365 계정 회원가입 진행
2. 인천무크 바로가기 버튼을 클릭하여 i-MOOC에서 로그인

※회원가입에 필요한 Office 365 인증코드는 소속학교 선생님을 통해 확인하실 수 있습니다.

비디오이미지
진행중 한글

(Spring) 기초부터 시작하는 강화학습 및 신경망 알고리즘

  • 코스/코스구분

    인공지능 / 청강
  • 기관

    donggukUniv
  • 언어/번역

    한글/한글
  • 학습 기간

    단기(1~5주)
  • 수강 신청 기간

    2020.12.31 ~ 2021.02.27
  • 강좌 수강 기간

    2021.02.28 ~ 2030.12.30
신청마감

기초부터 시작하는 강화학습 및 신경망 알고리즘



교재 : 신민규, 기초부터 시작하는 강화학습 및 신경망 알고리즘, 위키북스, 2019.
강의소개 : 본 강화학습 및 인공신경망에 관련한 교과목
강사 : 성연식 (sung@mme.dongguk.edu)

[강의 내용]
1장. 인공지능이란?
1. 머신러닝의 종류, 2. 강화학습과 신경망

2장. 강화학습
1. 강화학습의 기본 요소
2. 환경과 에이전트 준비
3. 가치함수 : 상태/행동의 가치 계산 (상태가치함수)
3. 가치함수 : 상태/행동의 가치 계산 (행동가치함수)
4. 동적계획법 : 최적 정책 선택 (정책평가)
4. 동적계획법 : 최적 정책 선택 (정책개선)
5. 몬테카를로 방법 (Prediction)
5. 몬테카를로 방법 (Control)
6. 시간차 학습 (Prediction)
6. 시간차 학습 (Control: SARSA & Q-learning)
6. 시간차 학습 (Double Q-learning & 정책 그레이디언트 : 익터-크리틱)
7. 함수 근사

3장. 인공신경망
1. 퍼셉트론~3. 경사하강법
4. 퍼셉트론의 학습
5. 다층 퍼셉트론~6. 활성화 함수
7. 오차역전파법
8. 학습최적화~9. 배치
10. 케라스를 이용한 신경망 구현
11. 합성곱신경망
12. 케라스를 이용한 합성곱신경망 구현

4장. 인공지능 만들기: 틱택토 게임
1. 틱택토 준비
2. 인간 플레이어~5. 몬테카를로 플레이어
6. Q-learning 플레이어
7. DQN 플레이어

[첨부] 패키지 설치 및 주피터노트북 사용법

신청마감
ATMOOC 문의
운영 시간 안내
평일: 10:00 ~ 18:00
이외의 시간은 이메일로 문의부탁드립니다.