Data Analysis Practice I

Numbering Code U-LAS11 20003 SJ55 Year/Term 2021 ・ First semester
Number of Credits 2 Course Type Seminar
Target Year All students Target Student For all majors
Language Japanese Day/Period Tue.5
Instructor name KIMURA MASAYUKI (Institute for Liberal Arts and Sciences Program-Specific Senior Lecturer)
Outline and Purpose of the Course コンピュータやネットワーク,様々なセンサなどの技術の進歩により,日々膨大なデータが蓄積されるようになった.よって今日ではデータの活用が課題となり,データを適切に分析し,その結果から適切な判断を下すことが重要である.「データ分析演習I」では,データ科学の基礎をなすデータ解析手法の理論や実装法などを実践的に学び身につけることを目的とする.まず,データ科学の分野で広く用いられているPython の導入法や基礎プログラミングを修得し,データの取得方法や整形,可視化など,データ科学に必要不可欠な技術を学ぶ.続いて回帰分析や教師あり/教師なし機械学習の基礎理論と実装法を修得する.具体的には,重回帰,ロジスティック回帰,Ridge,Lasso,サポートベクターマシン,ランダムフォレストなどの決定木,ニューラルネットワーク,k近傍法,k平均法,多様体学習,主成分分析などを学ぶ.
Course Goals 1. データ分析の理論的基礎となる確率論や統計学,線形代数学の基礎を理解する.
2. Python 言語を用いてデータ分析に必要な基礎的な統計処理ができるようになる.
3. 回帰分析,機械学習,クラスタリングについて概要を理解し,プログラミング言語による実装方法を理解する.
Schedule and Contents 第1回 データサイエンス概観とPythonの導入
第2-4回 Pythonプログラミング入門
第5回 NumPy入門
第6回 pandas入門
第7回 データの入出力・整形
第8回 データの可視化
第9回 時系列データの解析
第10回 機械学習の基礎
第11回 回帰分析
(重回帰, ロジスティック回帰, Ridge, Lasso)
第12回 教師あり機械学習
(サポートベクターマシン,ランダムフォレストなどの決定木,ニューラルネットワーク,k近傍法)
第13回 教師なし機械学習
(k平均法,多様体学習,主成分分析)
第14回 テキストデータの解析
第15回 レポート解説およびフィードバック
Evaluation Methods and Policy 講義中に与える課題に対するレポートの内容によって到達目標への到達度を評価する.
Course Requirements 共通教育における微積分,線形代数,確率,統計程度の内容を理解していることが望ましい.また,プログラミングの初歩的技術を習得していることが望ましい.
Study outside of Class (preparation and review) 復習として,講義で解説した内容を自らプログラムを組んで実装し,様々なデータに対して適用してみることを期待する.
Textbooks Textbooks/References 講義資料のPDF版を配布する。
References, etc. Pythonによるデータ分析入門 第2版 ― NumPy、pandasを使ったデータ処理―, Wes McKinney, (オライリージャパン, 2019), ISBN:978-4-87311-845-1
Pythonデータサイエンスハンドブック -Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習, Jake VanderPlas, (オライリージャパン, 2019), ISBN:978-4-87311-841-3
入門 Python 3, Bill Lubanovic, (オライリージャパン, 2017), ISBN:978-4-87311-738-6
PAGE TOP