カテゴリ:データサイエンス
演習概要
個人でテーマを決め、データ分析を行う。最後に発表を行う。
テーマ
グループ全体でテーマを決め、その中で個人のテーマを決めること。
グループ単位でのテーマの重複は出来ない。
※グループ全体のテーマは大きなテーマで良い(健康など)
※個人としてそこから外れるテーマがあっても良い(こじつけてもよい)。グループ全体のテーマは何も思いつかない人にとってのヒントとなるだけである。
内容
以下のような内容から自由に決定する。
- データ分析(DataFrameによる分析、グラフの作成)
- 地図による分析
- 機械学習による予測
- その他(要相談)
過去の例
- 水がおいしい都道府県 食生活に共通点があるのか
- 野球人口と球場数の関係
- 私の住む町は子育てがしやすいのか
- 機械学習による円高円安予測
- ワールドカップ代表の所属チームマップ
- KFCとクリスマス
データ分析の手順
原則としてPPDACサイクルで行う。プロジェクト管理サイト に記述していく
ソースコードの生成などにAIを使用してよい(ただし、内容が正しいことを確認すること)
グループの役割
- テーマ決定
- 1日の最初、午後の最初にミーティングを行う (進捗状況、問題点の報告)
- 分からない点、詰まった点などを助け合う。
- 発表を助け合う。
発表
原則としてPowerPointで行う。途中で実行画面や別サイト画面などを見せても良い。
PPDACサイクルに従って説明する。
- 最終日に発表を行う。
- 1人5分。グループ毎。
- なぜそのテーマを選択したかも入れるとよい。
- テーマのバックグラウンドとなる情報を入れてもよい
- 発表時の順番はグループ内で決める。
投票
発表終了後にどのグループの発表が良かったかの投票を行う。自分が所属するグループには投票できない。
注意事項
- データ分析は原則として仮説を立てて分析する。結論が仮説と違っても良い。
- 結論はデータから導くこと。データによらない主観から導かない(推測として発表しても良い)。
- 発表には試行錯誤の過程も入れる(時間に収まれば)。
- PowerPointには話すことを全て書かない。要点を書く。文字の大きさは大きくする。
- データの出典を書くこと。