Practical data analysis
Numbering Code | P-GOV01 63150 OJ45 | Year/Term | 2022 ・ First semester | |
---|---|---|---|---|
Number of Credits | 2 | Course Type | lecture and seminar | |
Target Year | 1st & 2nd year students | Target Student | ||
Language | Japanese | Day/Period | Thu.3・4 | |
Instructor name | MATSUI HIROYUKI (Graduate School of Management Professor) | |||
Outline and Purpose of the Course |
世の中には様々な資料やデータが存在する。統計学は、集団現象に関するデータを収集し、その集団の特質をデータに基づいて記述・推測する方法に関する科学である。行政分野においては、各種統計データの収集や分析、住民調査など応用範囲も広く、また近年ビックデータやデータサイエンスで注目されているように、統計学の知識をベースに、データを正しく収集・分析し、適切な評価・判断を下せる能力は重要性を増している。 そこで、本講義では、基礎的な統計学の知識を有するが、統計学をどのように活用して良いのか分からない学生を対象に、実際に必要となるデータを収集するための手法、統計解析ツールを活用し、種々のデータを整理・分析して意味や価値のある情報を抽出したり、あるいはデータを表現・解釈するためのモデルを構築し、適切な評価・判断を下せるために必要となる実務能力を修得することを目指す。 |
|||
Course Goals |
データ分析における代表的な問題解決のフレームワーク(PPDACサイクル)に従い、それぞれのサイクルでの活動を理解し、統計解析ツールを使って実際にできるようにする。 ・問題発見(Problem):問題の把握と明確化、分析すべきデータと仮説の予想 ・調査の計画(Plan):社会調査、統計調査資料 ・データ収集(Data):データの収集、データの整備、データクレンジング(クリーニング) ・分析(Analysis):データ可視化、傾向分析、比較分析、関連分析 ・結論(Conclusion):分析結果の解釈、レポート作成、意思決定 |
|||
Schedule and Contents |
(授業計画と内容) PPDACサイクルに従って、それぞれのサイクルでの活動で必要となる知識について講義し、その上で、実際に統計解析ツール等を使った実習を行い、実践的なデータ解析能力の習得を目指す。 1.データ分析とは何か、PPDACサイクルについて 2.問題発見(Problem):テーマ設定、因果分析 3.調査の計画(Plan):社会調査法、統計調査資料の基礎 4.データ収集(Data):データ収集、ウェブスクレイピング、データクレンジング(クリーニング) 5.分析(Analysis):仮説検定、回帰分析、因果分析の基礎と実施 6.結論(Conclusion):分析結果の解釈、レポート作成 7.データマネジメント:研究の再現性 8.様々な統計ツール 9.総合演習 以上のテーマに沿って、個々のテーマについて2ないしは3回の講義・演習を割り当て、合計15回の講義を実施する。 |
|||
Evaluation Methods and Policy |
講義中に課す演習課題レポート(70%)+最終レポート(30%) 講義に関する演習課題レポート(5回程度を予定)を課し、その提出を求めることで、データ分析に関する基本的な内容の理解を深めた上で、最終レポートとして、現実のデータを用いた分析レポートを作成することで、実践的なデータ分析能力を確認する。 |
|||
Course Requirements |
基礎的な統計学の知識を修得していること。本講義内では、基礎的な統計学についての講義は行わない。具体的には、公共政策大学院の開講科目「政策分析のための統計基礎」を履修済みか、同等の統計学に関する知識(記述統計、推測統計の基礎)を有していること。最低限の基準としては、統計検定3級、可能であれば統計検定2級程度の能力を有していることが望ましい。 統計ツールを使った実習を行うので、各自でノートPCを持参すること。本講義で利用する統計ツールは表計算ソフト(EXCEL、Numbers等)およびR言語である。Rについては、クラウド環境のサービス(Google Collaboratory)を用いた実習を行うのでChrome等のブラウザが動く環境があれば良い。その他の統計ツール(JMP、Orange、Stata、Python等)やBIツールについては、基本的に概要を扱うのみである。 注意:データ分析分野では、使い勝手のよい統計ツールが数多く存在する。京都大学においてもJMPのキャンパスライセンスを有しており、また学生であれば、アカデミックプライスで各種統計ツールを安価に利用可能である。しかしながら、社会人になった場合に、予算の都合等で、これらのツールを継続的に利用できるとは限らない。そこで、本講義では、フリーで利用可能なRを用いた実習を主として行い、市販の統計ツールについては必要に応じて紹介する。 他研究科聴講不可。 |
|||
Study outside of Class (preparation and review) |
本講義は、実際にデータを使った実習を実施する関係上、十分な作業時間を確保する必要がある。そこで隔週にて2コマ連続(原則として、第2週、第4週)で講義と演習を実施し、そのプロセスを踏まえ、復習としての課題レポートを科す。 なお、統計解析ツールの実習等の作業を講義時間で実施するが、ツールを使いこなすためには、課題を行うのみならず、各自で十分な自習が必要となるので注意すること。 |
|||
Textbooks | Textbooks/References | 基本的に、講義資料および関連資料はWebページ(PandA)で公開もしくは講義中に配布する。 | ||
References, etc. |
分析者のためのデータ解釈学入門 データの本質をとらえる技術, 江崎貴裕, (ソシム,2020), ISBN:4802612907 データ分析に必須の知識・考え方 統計学入門 仮説検定から統計モデリングまで重要トピックを完全網羅, 阿部真人, (ソシム,2021), ISBN:4802613199 入門・社会調査法〔第4版〕: 2ステップで基礎から学ぶ, 轟亮,杉野勇,平沢和司, (法律文化社,2021), ISBN:4589041413 社会調査の考え方(上/下), 佐藤郁哉, (東京大学出版会,2015), ISBN:4130520261/413052027X 社会調査 しくみと考えかた, 原純輔, (左右社,2016), ISBN:4865281657 データ分析の力 因果関係に迫る思考法(光文社新書), 伊藤公一朗, (光文社,2017), ISBN:4334039863 「原因と結果」の経済学―データから真実を見抜く思考法, 中室牧子,津川友介, (ダイヤモンド社,2017), ISBN:447803947X Rによるデータ分析のレシピ, 舟尾暢男, (オーム社,2020), ISBN:4274226255 Rが生産性を高める データ分析ワークフロー効率化の実践, gjit,atusy,hanaori, (技術評論社,2022), ISBN:4297125242 Excelで学ぶデータ分析本格入門, 日花弘子, (SBクリエイティブ,2019), ISBN:4815602859 統計学の基礎から学ぶ Excelデータ分析の全知識, 三好大悟,堅田洋資, (インプレス,2021), ISBN:4295011088 Rをはじめよう生命科学のためのRStudio入門, Andrew P. Beckerman,Dylan Z. Childs,Owen L. Petchey/富永大介, (羊土社,2019), ISBN:4758120951 Rによる計量政治学, 浅野正彦,矢内勇生, (オーム社,2018), ISBN:4274223132 |