データ分析演習I

科目ナンバリング U-LAS11 20003 SJ55 開講年度・開講期 2021 ・ 前期
単位数 2 単位 授業形態 演習
配当学年 全回生 対象学生 全学向
使用言語 日本語 曜時限 火5
教員 木村 真之 (国際高等教育院 特定講師)
授業の概要・目的 コンピュータやネットワーク,様々なセンサなどの技術の進歩により,日々膨大なデータが蓄積されるようになった.よって今日ではデータの活用が課題となり,データを適切に分析し,その結果から適切な判断を下すことが重要である.「データ分析演習I」では,データ科学の基礎をなすデータ解析手法の理論や実装法などを実践的に学び身につけることを目的とする.まず,データ科学の分野で広く用いられているPython の導入法や基礎プログラミングを修得し,データの取得方法や整形,可視化など,データ科学に必要不可欠な技術を学ぶ.続いて回帰分析や教師あり/教師なし機械学習の基礎理論と実装法を修得する.具体的には,重回帰,ロジスティック回帰,Ridge,Lasso,サポートベクターマシン,ランダムフォレストなどの決定木,ニューラルネットワーク,k近傍法,k平均法,多様体学習,主成分分析などを学ぶ.
到達目標 1. データ分析の理論的基礎となる確率論や統計学,線形代数学の基礎を理解する.
2. Python 言語を用いてデータ分析に必要な基礎的な統計処理ができるようになる.
3. 回帰分析,機械学習,クラスタリングについて概要を理解し,プログラミング言語による実装方法を理解する.
授業計画と内容 第1回 データサイエンス概観とPythonの導入
第2-4回 Pythonプログラミング入門
第5回 NumPy入門
第6回 pandas入門
第7回 データの入出力・整形
第8回 データの可視化
第9回 時系列データの解析
第10回 機械学習の基礎
第11回 回帰分析
(重回帰, ロジスティック回帰, Ridge, Lasso)
第12回 教師あり機械学習
(サポートベクターマシン,ランダムフォレストなどの決定木,ニューラルネットワーク,k近傍法)
第13回 教師なし機械学習
(k平均法,多様体学習,主成分分析)
第14回 テキストデータの解析
第15回 レポート解説およびフィードバック
成績評価の方法・観点 講義中に与える課題に対するレポートの内容によって到達目標への到達度を評価する.
履修要件 共通教育における微積分,線形代数,確率,統計程度の内容を理解していることが望ましい.また,プログラミングの初歩的技術を習得していることが望ましい.
授業外学習(予習・復習)等 復習として,講義で解説した内容を自らプログラムを組んで実装し,様々なデータに対して適用してみることを期待する.
教科書 講義資料のPDF版を配布する。
参考書等 Pythonによるデータ分析入門 第2版 ― NumPy、pandasを使ったデータ処理―, Wes McKinney, (オライリージャパン, 2019), ISBN:978-4-87311-845-1
Pythonデータサイエンスハンドブック -Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習, Jake VanderPlas, (オライリージャパン, 2019), ISBN:978-4-87311-841-3
入門 Python 3, Bill Lubanovic, (オライリージャパン, 2017), ISBN:978-4-87311-738-6
PAGE TOP