Information Analysis and Management, Exercise

Numbering Code G-LAS12 80020 SJ13 Year/Term 2022 ・ First semester
Number of Credits 1 Course Type Seminar
Target Year Graduate students Target Student For all majors
Language Japanese Day/Period Mon.5
Instructor name SUGIYAMA KAZUNARI (Graduate School of Informatics Program-Specific Associate Professor)
MASUDA HISASHI (Part-time Lecturer)
Outline and Purpose of the Course 今日,文理の分野を問わず最先端の研究を進めていくには,大規模データの分析・管理技術が不可欠となっている.本講義では,コンピュータで問題を解くために必要なモデル化やアルゴリズムと,その情報検索への応用,データの管理およびデータから有用な情報や知識を発見するマイニング技術,情報の分析結果の可視化とインタラクション技術など,様々な分野で利用されているトピックを精選して,演習形式で具体的な問題を計算機で解く方法を学ぶ.

Course Goals 【研究科横断型教育の概要・目的】
上述したように,大規模データの分析・管理技術はあらゆる分野の研究に必要とされている.本授業では,それらの技術の仕組みの基礎を理解するとともに,「情報分析・管理論」と連携して,各自が具体的な問題に対して技術を実践できるレベルに到達することを目標としている.
Schedule and Contents ・ガイダンス(1回)(担当: 杉山)
 演習の準備およびプログラミング言語Rのインストール,簡単な使い方

・問題のモデル化と問題の解き方,情報検索(3回)(担当: 杉山)
 講義で扱った,グラフを用いたモデル化とアルゴリズム(オイラー閉路,最短経路)やPageRankについて,Rで実際に問題を解く方法を学ぶ.また,問題を解くだけでなく,可視化などを通じて結果を分析する基礎を身につける.

・データマイニング (5回) (担当: 増田)
 データを分析して,有用な情報や知識を発見するデータマイニング技術(相関ルール,クラスタリング,決定木,サポートベクターマシンなど)を,Rで実行する方法を学ぶとともに,得られた結果を解析する.

・データベース (2回) (担当: 杉山)
 情報を管理するデータベースをSQLiteを用いて設計する方法を学ぶ.

・情報検索(2回) (担当: 杉山)
 基礎的な情報検索の技術についての理解を深める.また,情報検索で用いられる評価指標に基づいて,実際の検索エンジンの検索結果を評価する.

・情報の可視化と対話技術 (2回) (担当: 杉山)
 分析結果などの情報の可視化,情報システムを利用者からのフィードバックに基づき改善する技術について,Python, Jupyter Notebookを用いた演習を行う.
Evaluation Methods and Policy 演習で扱った情報分析・管理技術を理解し,具体的な問題に応用し,実際にその解を計算できるようになることが達成目標である.出席状況,ならびに毎週のレポートによってこの目標に到達しているかどうかを検証し,成績を算出する.
Course Requirements - 情報分析・管理論を,原則として受講していること.
- プログラミングを伴う演習を受講する意欲があれば,プログラミング経験は問わないが、PCの基本的な使用方法を習得していること,何らかのソフトウェアをダウンロードした経験があることが望ましい.
- 各自のノートPC等の持ち込みを前提とする.
Study outside of Class (preparation and review) 必要な場合は授業中に指定する.
Textbooks Textbooks/References 特になし
References, etc. ネットワーク・大衆・マーケット: 現代社会の複雑な連結性についての推論 Crowds, and Markets: Reasoning About a Highly Connected World, D. Easley, J. Kleinberg (著), 浅野孝夫,浅野泰仁 (翻訳), (共立出版 Cambridge University Press)
アルゴリズム・デザイン Algorithm Design, Jon Kleinberg, Eva Tardos (著), 浅野孝夫, 浅野泰仁, 小野孝男, 平田富夫 (翻訳), (共立出版 Addison Wesley)
Biological sequence analysis -Probabilistic models of proteins and nucleic acids-, Richard Durbin, Sean R. Eddy, Anders Krogh, Graeme Mitchison., (Cambridge University Press)
パターン認識と機械学習 -ベイズ理論による統計的予測- 上・下巻 Pattern Recognition and Machine Learning, C.M. ビショップ(著), 元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇 (翻訳), (シュプリンガー・ジャパンSpringer-Verlag)
Database Systems: The Complete Book, H. Garcia-Molina, J. D. Ullman, J. Widom, (Prentice Hall)
An Introduction to Database Systems, C.J. Date, (Addison Wesley)
データベースの基礎, 吉川正俊, (オーム社)
Search Engines: Information Retrieval in Practice, W. Bruce Croft, Donald Metzler, Trevor Strohman, (Addison-Wesley)
Information Retrieval: Implementing and Evaluating Search Engines, Stefan Buettcher, Charles L. A. Clarke, Gordon V. Cormack, (The MIT Press)
デザイニング・インタフェース~ パターンによる実践的インタラクションデザイン ~, Jenifer Tidwell (著), ソシオメディア株式会社 (監訳), 浅野 紀予 (訳), (オライリー・ジャパン)
ビジュアライジング・データ Processingによる情報視覚化手法, Ben Fry (著), 増井 俊之 (監訳) (監修), 加藤 慶彦 (翻訳), (オライリー・ジャパン)
Search User Interfaces, Marti Hearst, (Cambridge University Press)
PAGE TOP