コンテンツに飛ぶ | ナビゲーションに飛ぶ

  • 日本語
  • English
 
現在位置: ホーム ja シラバス(2020年度) 理学部 共通又は専門基礎科目 実践データ科学入門 実践データ科学入門

実践データ科学入門 実践データ科学入門

JA | EN

科目ナンバリング
  • U-SCI00 33006 LJ55
開講年度・開講期 2020・後期
単位数 2 単位
授業形態 講義
配当学年 3回生以上
対象学生 学部生
使用言語 日本語
曜時限 木4
教員
  • 中野 直人(国際高等教育院 特定講師)
授業の概要・目的 理学部・理学研究科における研究ではデータに触れる機会が多くなり,そのデータから有用な情報を引き出すためにデータ解析手法の習得は欠かせない.データの性質や目的に応じて用いるべき解析手法は変わり得る.したがって,幅広いデータ科学的手法の習得は,現代科学において分野を問わず強く求められるプロセスであると言える.
この講義では,理学部における研究に役立つ統計解析や機械学習の基盤的な解析手法について学習する.理論的側面と技術的側面の両方に触れることで各解析手法を理解する.さらに,プログラミング実習によって学習した内容を各自で実践し,身につけることを目的とする.
到達目標 実践に役立つように,データ解析に用いられる統計解析と機械学習の各手法の理論的枠組みを理解する.実習を通して,学んだ各手法を自分で実装できるようにし,その手法によってどのような情報がデータセットから抽出可能かを理解する.
授業計画と内容 統計解析と機械学習から4トピック学習する.1トピックあたり,講義1回+実習2,3回の構成を基本とするが,進度や受講生の理解の状況に応じて変更する.実習では学生は3,4人1グループに分け,各トピックの実習最終週にはグループ毎に成果発表をおこない,適宜フォローアップの時間を設ける.尚,授業回数はフィードバックを含め全15回とする.

A)統計解析
 1.回帰分析・主成分分析・因子分析(3週)
 2.独立成分分析(4週)
B)機械学習
 3:多層パーセプトロン,決定木(3週)
 4:畳み込みニューラルネットワーク(もしくは強化学習)(4週)

実習でのプログラミング言語としては,主に Python を用いる.計算環境は学生所有の個人PCに Anaconda で導入し,Jupyter Notebook を用いる.実習に関する導入に関しては,最初の実習のときに説明する.
履修要件 データ解析に必須な知識として,線形空間,連立一次方程式,固有値問題などの線形代数と条件付極値問題などの微積分学の事項が挙げられるため,これらの知識を前提とする.これは理学部1 年次の微分積分学と線形代数学で習得できる程度の知識で十分である.
実習では学生は個人PCの利用を前提とする.成果発表においても学生のノートPCをプロジェクタに接続して行うこととする.
講義では Python 入門から始め,さらに各単元では資料としてサンプルプログラムを配布するため,プログラミングの能力は基本的には仮定しない.とはいえ演習でプログラミングを避けては通れないことから,Python の初歩的な取り扱いには慣れておくことを勧める.
授業外学習(予習・復習)等 講義ではデータ解析手法の理論や手続きについて説明し,実習を通して学習した内容について実践的な技術を身につける.そのため,円滑な実習の遂行のためには講義内容の復習が必要であり,プログラミングに熟達するため個人PCでの実習の復習を強く推奨する.
参考書等
  • 参考書は指定しない.資料が必要な場合には授業中にPandAを通じて配布する.