【ITエンジニアコース】IoT/Phtyonを活用したデータ分析講座

開催日:2019年8月27日 - 28日、9月3日

レポート

  • 講座

ITエンジニア向けの、『IoT/Pythonを活用したデータ講座』が開催されました。
今回は、 『IoT/Pythonを活用したデータ講座』は計5日間のプログラムの 「AI・機械学習」 「Pythonによるデータ分析」 を扱った、最後の3日間の様子を紹介いたします。 最初の2日間の内容は こちら をご覧ください。

AI・機械学習

AI、機械学習、ディープラーニングという言葉をよく耳にしますが、まずはこのキーワードについて言葉の定義や意味合いを整理することから始めました。 キーワードの位置づけとしては、 最も広義に範囲を持つのがAIであり、機械学習とディープラーニングを内包する関係 になっています。 機械学習とは、コンピュータがデータから特徴的なパターンを学習し、そのパターンを基に判断や予測を導き出すものです。 機械学習の中には、ディープラーニング以外にも、その他の学習の仕組みが存在しており、目的に合わせて適切な手法を選択して結果を生み出していくことになります。 AI・機械学習のキーワードを整理しながら、AIを活用したサービスの成功例や、AIに関する各種サービス・ツールについても学習しました。

データ分析

データ分析というが実際にデータ分析で何ができるのか…。データ分析では 「現業把握」 「仮説の裏付け」 「予測」 などができるようになります。

現業把握

  • 既存のデータを加工して要約し、データの特徴を把握する事ができる。
  • 分析結果と業務経験を結びつけると、新たな仮説が発想される可能性がある。

仮説の裏付け

  • 経験や現状把握から発想した仮説を今後の施策つなげるため、仮設の正しさを数学的に立証することができる。

予測

  • 既知の情報から未知のデータを予測することができる。
  • モデルを作成することで自動化することも可能になる。

ただ、データ分析は、分析の工程だけで成り立つものではなく、分析の前には 「計画」 「データの準備」 が必要になります。 この工程をなおざりにして、失敗している分析プロジェクトは多数あるため、分析はビジネス・社会において何等かの価値を見出すことが目的なので、分析結果の活用プロセスも必要です。

計画

「データを使って取り組みたいこと」を発送し、収集対象のデータや分析手法などの計画を立てる。
発想の段階では、ビジネス知識・スキルおよび業務知識が求められれます。その後、ICTや分析の専門家も交え、実現可能な計画に仕立てます。

データ準備

分析計画に基づき、必要なデータを用意します。収集したデータをそのまま分析することができるケースは少ないため、分析できる状態までデータを加工します。 加工は、全プロセスの中で最も時間がかかります。

データ分析

分析計画に基づき、データを分析し、得られた結果を数学的に評価します。求める結果が得られなかった場合には、手法を変えて分析するか、データを準備し直して再度分析します。

活用

分析で得られた結果をビジネス観点で解釈し、ビジネスで活用できるかどうが、検討します。活用する施策はデータから分かったことを基にします。

Pythonによるデータ分析

データ分析の基礎や、データ分析のプロセスを学習したところで、今度はPythonを用いてデータ分析を行っていきます。 Pythonは分析系のライブラリが豊富なため、データ分析によく用いられるプログラミング言語になります。 Pythonに関しては、この講座の1~2日目にも学びましたが、今回はプログラミング言語の学習ではなく、データ分析の世界がメインになります。

Jupyter Notebookを用いたデータ解析

Pythonでデータ分析を行う場合、 Jupyter Notebook というデータ解析ツールを使ってデータ分析を行います。この分析ツールはデータサイエンティストの間でも広く使われているもので、この講座でもJupyter Notebookを使用して、Pythonを使ったデータ分析を体験してもらいました。 今回は以下のプログラムの内容でデータ分析を実践していただきました。
  • データの加工と集計(Pandasライブラリ)
  • データの要約とグラフ化(Matplotlibライブラリ)
  • 機械学習(scikit-learnライブラリ)
  • 分類モデルの作成と評価(ロジスティック回帰とランダムフォレスト)
  • 回帰モデルの作成と評価(線形回帰とランダムフォレスト回帰)
  • 機械学習と関連したデータ処理
  • データの収集
  • 機械学習システムの構築(Flask)
約2日間データ分析を体験してもらいました。内容としては、かなり専門的な知識に触れ、またボリュームもあるものでしたので、ここでは細かくご紹介することはできませんが、内容の濃い実習になったと思います。

全体を振り返って

Raspberry PiのIoTデバイスの試作から始まり、Phtyonのプログラミング、データ分析と5日間体験して頂きました。 最後の3日間は、データサイエンティストの専門的な分野に触れましたが、データをどのように加工すればいいのか、 データの特徴を見極めるにはグラフ等からどう判断したらいいのか、これらは数多くの経験を積んでいかないと、 使いこなすことができない難しい分野だと感じます。実際に活用していくには、専門的な人とタッグを組んでいかないと、なかなか思い通りには使いこなすことができないものかもしれません。 ただ、データの収集から蓄積、分析まで、一通りのプロセスを体験していただき、データを活用するまでのイメージを持っていただけたと思います。
参加者の方には、今回使用したRaspberry Piと各種センサーをお持ち帰りいただいたので、プロトタイプを作成したり、または自社の強みとなるデータをどのように活用していくことができるか考えてもらえるきっかけになってもらえれば嬉しく思います。

information

富士通ラーニングメディア 生方 史郎

2016年 株式会社富士通ラーニングメディアに入社。
インストラクターとして、データサイエンス、特に機械学習、ビジネスインテリジェンス関連技術を担当。

【主な実績】
ビッグデータ分析人材育成
データサイエンス人材育成

【専門分野】
AI(機械学習/Deep Learning) 関連講座
ビジネスインテリジェンス 関連講座
分析ソフトウェア(Pythonなど)を使用したデータ分析

【資格】
日本ディープラーニング協会 「JDLA Deep Learning for GENERAL2017」

本事業では、ITエンジニアコースの講座担当