Information Analysis and Management

Numbering Code G-LAS12 80022 LJ13 Year/Term 2022 ・ Second semester
Number of Credits 2 Course Type Lecture
Target Year Graduate students Target Student For all majors
Language Japanese Day/Period Mon.4
Instructor name SUGIYAMA KAZUNARI (Graduate School of Informatics Program-Specific Associate Professor)
MASUDA HISASHI (Part-time Lecturer)
Outline and Purpose of the Course 今日,文理の分野を問わず最先端の研究を進めていくには,大規模データの分析・管理技術が不可欠となっている.本講義では,コンピュータで問題を解くために必要なモデル化やアルゴリズムと,その情報検索への応用,データの管理およびデータから有用な情報や知識を発見するマイニング技術,情報の分析結果の可視化とインタラクション技術など,様々な分野で利用されているトピックを精選して講述する.特に,具体的な問題に対して,それらの技術をどのように適用できるかを学ぶことで,技術の基本的な考え方を理解し,各自の分野において,応用できるようになることを目標とする.
Course Goals 【研究科横断型教育の概要・目的】
上述したように,大規模データの分析・管理技術はあらゆる分野の研究に必要とされている.本授業では,それらの技術の仕組みの基礎を理解するとともに,「情報分析・管理演習」と連携して,各自が具体的な問題に対して技術を実践できるレベルに到達することを目標としている.
Schedule and Contents ・ガイダンス (1回) (担当: 杉山)
 講義全体の概要

・問題のモデル化と問題の解き方,情報検索(3回)(担当:杉山)
 コンピュータで問題を解くために必要となる,問題のモデル化と,問題の解き方,すなわち,アルゴリズムについて学ぶ.具体的には,まず,グラフを用いたモデル化,アルゴリズムとその戦略(計算量,近似,動的計画など),情報検索に用いられるランキング手法 (PageRankやHITSなど) の応用について講述する.さらに,情報科学の他分野への応用について学ぶ.

・データマイニング (5回) (担当: 増田)
 データを分析して,有用な情報や知識を発見するための手法について講述する.具体的には,データマイニング技術(アソシエーションルール,クラスタリング,決定木,サポートベクターマシンなど) と,そこで利用されている機械学習やベイズ推定の技術を学ぶ.

・データベース (2回) (担当: 杉山)
 大規模な情報を管理するデータベース技術について講述する.


・情報検索(2回) (担当: 杉山)
 大量の文書データから必要な情報を検索する技術について講述する.基礎的な検索モデル,索引技術やランキング学習について学ぶことで,現状の検索システムがどのように動作しているのかを理解する.また,検索システムの性能を定量的に評価する方法について理解を深めることにより,より良い検索システムを選択・構築する方法を身につける.

・情報の可視化と対話技術 (2回) (担当: 杉山)
 分析結果などの情報の可視化,インタラクション技術,情報発信技術を取り上げる.
Evaluation Methods and Policy 講義で扱った情報分析・管理技術の仕組みを理解し,具体的な問題に応用し,実際にその解を計算できるようになることが達成目標である.各回の出席状況,ならびに数回ごとに扱うテーマに基づいたレポートによって,この目標に到達しているかどうかを検証し,成績を算出する.
Course Requirements - 「情報分析・管理演習」を,原則として受講すること.
- 各自のノートPC等の持ち込みを前提とする.
Study outside of Class (preparation and review) 必要な場合は授業中に指定する.
Textbooks Textbooks/References 特になし
References, etc. ネットワーク・大衆・マーケット: 現代社会の複雑な連結性についての推論 Crowds, and Markets: Reasoning About a Highly Connected World, D. Easley, J. Kleinberg (著), 浅野孝夫,浅野泰仁 (翻訳), (共立出版 Cambridge University Press)
アルゴリズム・デザイン Algorithm Design, Jon Kleinberg, Eva Tardos (著), 浅野孝夫, 浅野泰仁, 小野孝男, 平田富夫 (翻訳), (共立出版 Addison Wesley)
Biological sequence analysis -Probabilistic models of proteins and nucleic acids-, Richard Durbin, Sean R. Eddy, Anders Krogh, Graeme Mitchison, (Cambridge University Press)
パターン認識と機械学習 -ベイズ理論による統計的予測- 上・下巻 Pattern Recognition and Machine Learning, C.M. ビショップ(著), 元田浩, 栗田多喜夫, 樋口知之, 松本裕治, 村田昇 (翻訳) , (シュプリンガー・ジャパンSpringer-Verlag)
Authoritative Sources in a Hyperlinked Environment, Jon M. Kleinberg, (Journal of the ACM (JACM), 46(5), pages 604-632, 1999.)
The PageRank Citation Ranking: Bringing Order to the Web, L. Page, S. Brin, R. Motwani, and T. Winograd, (Technical Report SIDL-WP-1999-0120, Stanford Digital Library Technologies Project, 1998.)
PAGE TOP