Statistics and Artificial Intelligence
Numbering Code | U-LAS11 20007 LE55 | Year/Term | 2022 ・ Second semester |
---|---|---|---|
Number of Credits | 2 | Course Type | Lecture |
Target Year | Mainly 2nd year students or above | Target Student | For all majors |
Language | Japanese | Day/Period | Tue.3 |
Instructor name |
KASHIMA HISASHI (Graduate School of Informatics Professor) YAMADA MAKOTO (Graduate School of Informatics Associate Professor) |
||
Outline and Purpose of the Course |
統計に関する知識は、実験、試験、調査などの結果を用いた実証研究を行う上でなくてはならないものである。生活に関わるさまざまな効果やリスクがデータとともに語られ、生活者としても統計に対するリテラシーが求められるようになった。企業活動では、情報技術の発展によって、日々膨大なデータが生成されており、その活用が求められるようになった。 本講は、研究や、生活、社会・経済活動に不可欠な統計を、集計・分析し、理解する力を養うことをひとつめの目的として、科目「統計入門」で扱えなかった、やや発展的な話題を中心に講義することで、より発展的な統計・統計学の学習への礎となることを目指す。 本講義は、文部科学省のモデルカリキュラム(応用基礎レベル)の、データサイエンス基礎・データエンジニアリング基礎・AI 基礎をバランスよくカバーする形で構成されている。 具体的には、平均の差の検定、分散分析、相関と回帰・判別分析の基礎について解説するとともに、一般化線形モデルによるこれらの統一的な理解を行う。さらに、因果推論の基本的な考え方と、具体的な方法についても解説を行う。 さらに、本講では第二の目的として、近年注目されている人工知能について、その基本的な考え方や応用について理解することで、現在も目まぐるしい早さで発展している当該分野への橋渡しを行う。近年の人工知能技術は膨大なデータをもとにした統計的なアプローチに基づいており、統計学がどのような形でその基礎を形作っているかを中心に学ぶ。 具体的には、機械学習における基本的な統計的手法をはじめ、ニューラルネットワーク、深層学習など、近年大きく発展している技術、また、それらの応用として自然言語処理や画像処理などの話題について解説する。 本講は、統計分析手順や人工知能手法の機械的な利用や解釈だけを講義するのではなく、その基礎となる考え方を学ぶことを目指しているが、あくまで直感的な理解を目指すことを主な目標とし、厳密な数学的証明等は避ける。 |
||
Course Goals |
1. 統計的検定と推定の考え方、とくに平均の差の検定・分散分析の考え方を理解し、これを実施できる。 2. 相関と回帰について理解し、これを実施できる。 3. 因果推論の基本的な考え方と手法を理解する。 4. 人工知能・機械学習の基本的な考え方と手法を理解する。 5. 統計と人工知能の手法と応用について幅広く知り、今後の学習につなげる。 |
||
Schedule and Contents |
授業回数はフィードバックを含め全15回とする - 統計の基礎概念の復習(検定・推定)3回 - 相関・回帰分析 2回 - 統計的因果推論 2回 - アルゴリズムとデータ構造(プログラミングの復習を含む) 1回 - 人工知能概説(AIの歴史と応用分野) 1回 - 機械学習(認識・予測・判断) 2回 - ニューラルネットワーク・深層学習の基礎と展望 1~2回 - 自然言語処理・画像処理 1~2回 - 発展的話題(AIの実社会応用・社会の関わり) 1回 (上記予定は目安であり、実際の講義の進度に応じて変更・前後することがある) |
||
Evaluation Methods and Policy | 随時実施するテストやレポート等によって、講義で解説した基本的概念・原理の理解度、データの収集・集計・分析・解釈についての応用力を評価する。 | ||
Course Requirements | 「統計入門」レベルの内容を理解していることが望ましい。 | ||
Study outside of Class (preparation and review) | 講義を中心とするが、講義で扱った内容を、具体的なデータを用いて復習することが望ましい。また、講義中に演習課題を出題する。 |