しぷぜん

しぷぜん

素人プログラマなおいがStep Zero to Oneしていくブログ

【機械学習】折角だからtoto BIGやってみる(AzureML編)

にほんブログ村 IT技術ブログ Pythonへ

こんにちは、なおいです。

 

前回から少し経ちました?が、続きです。

 

このシリーズとしては少しぶりですね。

一応前回以前を読まれていない場合は、こちらからよろしくお願いします。

一つ目は大したことない内容なのでいいですが、二つ目はそれなりにスクレイピングやってみてるので見てくれると嬉しいです。

  

 

ct-innovation01.hateblo.jp

 ct-innovation01.hateblo.jp

 

参考にした本です。

     

Pythonクローリング&スクレイピング

PythonによるWebスクレイピング

では、本編ですね。まずは、比較元として前回のスクレイピングで取得したCSVを無加工で使ってみてどんな結果が起こるかを確認しておきます。

その他の情報やハイパーパラメータなどなどを使ってどこまで精度があげられるかを確認したいですからね。

 

実際に自分自身でいろいろ実装するのもありかと思いますが、Tensorflowやchainerなどいろいろといいライブラリがありますし、そこらへんを最終的には使っていこうとは思いますが、今回はお試しなので簡単に組めるAzureMLを使ってみたいと思います。

 

基本使用は無料でかなりグラフィカルに使えるのでサクッとやるぶんには非常に便利です。

 

Microsoft Azure Machine Learning Studio

 

実際にAPIとして発行してサービスとすることもできますが、何回使うかなんかで料金がかかるとのことです。

 

私は実際の使い方を、このセミナーで学びました。が、他のブログやいろんなところでも紹介はされてるかと思います。

 

ai-kenkyujo.com

 

 で、こんな感じで組んでみました。

f:id:ct-innovation01:20170904234324p:plain

 

HOMEとAWAYがそれぞれ何点取るかを別々に予想させています。

結果はこんな感じ。太枠で囲まれたのが、予想と正解が合致したところです。

f:id:ct-innovation01:20170904234535p:plainf:id:ct-innovation01:20170904234544p:plain

 

んーこれはひどい

ここから、どれぐらいパラメータや他の情報を付加することで予想の精度が上がるかこれから試していきます。不定期更新にはなるかと思いますが、頑張っていきます。