論理生命学
Numbering Code |
G-INF05 63511 LJ63 G-INF05 63511 LJ10 |
Year/Term | 2022 ・ First semester | |
---|---|---|---|---|
Number of Credits | 2 | Course Type | Lecture | |
Target Year | Target Student | |||
Language | Japanese | Day/Period | Wed.3 | |
Instructor name | ISHII SHIN (Graduate School of Informatics Professor) | |||
Outline and Purpose of the Course |
ヒトを含む動物の環境適応能力を情報処理システムとして理解するための手法とその応用について講述する.具体的には,不確実環境における最適な行動決定のための計算原理,とくに最適行動方策の獲得を目的とした強化学習の理論,その脳・神経系における実装,さらに,ゲームやロボットなどの実問題への応用について講義する. |
|||
Course Goals | 強化学習の理論と応用,計算神経科学の考え方を理解する. | |||
Schedule and Contents |
強化学習の理論(9回) 確率的に遷移し,かつ報酬が得られるような環境への自律的適応のアルゴリズムである強化学習の理論について解説する.具体的には,マルコフ決定過程とその解法である動的計画法,価値ベース強化学習法,方策ベースの強化学習法について,その工学応用も含めて講述する.さらに近年進展の著しい深層強化学習についても述べる. 神経科学における強化学習(4回) 強化学習は不確実な環境における意思決定過程のモデルとしても使われている.認知神経科学における意思決定のモデルについて,強化学習に関連した最新の知見を紹介する.また,実験動物を用いた意思決定のモデルについて,強化学習に関連した最新の知見を紹介する. 強化学習の工学応用(2回) 不確実環境における自律的適応を可能とする強化学習は,ゲームやロボットの自律学習などへの工学応用に期待がもたれている.本項目では,強化学習の実問題への応用について紹介する. |
|||
Evaluation Methods and Policy |
レポート試験の成績(60%),平常点評価(40%) 平常点評価には,授業への参加状況,簡単な課題への評価を含む.成績評価は,情報学研究科成績評価規程第7条による. |
|||
Course Requirements | None | |||
Study outside of Class (preparation and review) | 期間内に簡単な課題,期末にプログラミングを含むレポート課題を出題する. | |||
Textbooks | Textbooks/References |