「社会人のためのデータサイエンス演習(統計局)」を受講したので感想など

2019年6月18日

第3回総務省のデータサイエンス・オンライン講座「社会人のためのデータサイエンス演習」が開講中。
本講座では、ビジネスにおける実践的なデータ分析の手法を、動画講義とexcelを使った演習問題を通して学ぶことができるよう。

今回、一通り講義を受け終わったので講義概要と感想をまとめてみます。基礎的な知識は持っていたので(本当に基礎の基礎ですが)演習問題はなんとか無事全問正解できました。

対象講座

総務省統計局提供「社会人のためのデータサイエンス演習」
http://gacco.org/stat-japan2


本講座の補助教材(A4判 全135ページ)も販売されています。 公式から購入できるのはamazonか日本統計協会です。

社会人のためのデータサイエンス演習オフィシャルスタディノート改訂版

受講時期を逃してしまった方は、次の開講まで待つか、こちらを参照してみてはいかがでしょうか。

概要

総学習時間:(1回5~10分程度×5~6講義)×5週

第1週:データサイエンスとは
“データサイエンス”とは
必要とされる背景、 求められるスキル・知識
分析の進め方・手法

第2週:分析の概念と事例
実践的なビジネス課題について、データの把握や比較を行う。

第3週:分析の具体的手法
クロス集計
散布図と相関関係
時系列データの見方、解釈の仕方

第4週:ビジネスにおける予測と分析結果の報告
回帰分析とモデル評価
分析結果の報告
予測・分類等代表的手法と活用場面

第5週:ビジネスでデータサイエンスを実現するために
おさらい、 まとめ
データ分析に基づく問題解決ケーススタディ
データサイエンティストいろいろ
企業でデータサイエンスを実現するためのポイント

所感

講座のレベル

内容は基礎的なものが多かった印象。一応「社会人のためのデータサイエンス入門」の次に受けるのを想定されているようです。

ただ、中央値や相関係数、分散、回帰分析といった基本的な統計の知識があれば「入門」を受けていなくても特に問題ありませんでした。

内容について

演習といわれている通り基本的な知識はついている前提で、実際にビジネスの場でデータ解析をするときどう進めていけばいいかの手本を示すような内容。

各講義を担当している先生たちは、データサイエンスに携わる専門家・大学教授・ 総務省統計局職員などそうそうたるメンバーでした。その先生たちが実際に現場で直面したと思われる例え話を聞けたのは、学習している身としては非常に新鮮で楽しかった。

演習問題について

講義というより基本的に演習メインでした。excelで解いていくのですが、本格的にデータサイエンスを始める人向けにRやpythonで解いた場合のもあってもいいんじゃないかと思った。

一方で意外とexcelでも高度なことができるというのも再認識させられた。時系列解析でトレンド、季節変動、不規則変動とかに分解できるのなんて知らなかった…。

各weekごとにテストがあるんですが、講義が丁寧なのもあり無事満点をとれました。修了証の発行が楽しみ。

社会人のためのデータサイエンス演習 成績
演習問題 成績

Pythonで解いてみて

本格的にデータサイエンス・機械学習を始めようと思うとやはりpythonやRで柔軟にデータ分析したい。ということでプログラミングの学習も兼ねてpythonで解いてみました。

コードはこちら。 同じようにpythonの練習を兼ねてやってみようという方が入ればご活用ください。
https://github.com/echomint/Data-science-practice-for-workers

基本的なコードとかデータの方とかを学習しつつ、解いていったので結構時間がかかってしまいました。

定型的な解析であればエクセルとかのGUIソフトで十分ですね。
もっと複雑な解析とか、予測モデルの細かな調整、モデル内部の把握とかをしようとすると、プログラミングのほうが柔軟で対応できるのでしょうし、pythonでの解析の初歩を経験するという意味ではよかったかと思います。