hiroyuki_tの日記
基礎から学ぶ機械学習(本の独習による勉強) 統計学・機械学習の勉強について以下を参考にして勉強する計画を立てました。 431日の計画ができました。 初級者向けは、コンピューターで「脳」がつくれるか以外を実施で、今月中に完了を目指します。 中級者向けは1冊 半月 or 1ヶ月用意しています。 初級者向けは行けると思いますが、 中級者向けは読む前に必要な前提知識もあり、かなり厳しいと考えています。 勉強を進めます。 データサイエンティストもしくは機械学習エンジニアを目指すならお薦めの初級者向け6冊&中級者向け15冊(2017年春版)
1 Oct 2017
一から始める機械学習(Kaggleで学ぶ機械学習) 機械学習の研修用の資料を作成しました。 一から始める機械学習(機械学習概要)の続編でKaggleを使用した実践編です。 Speaker Deck Qiita http://qiita.com/taki_tflare/items/8850ac5ba8b504a171aa
16 Sep 2017
一から始める機械学習(機械学習概要) 機械学習の研修用の資料を作成しました。 タイトル通り機械学習に今まで触れたことのない人を対象にしています。 Speaker Deck Qiita http://qiita.com/taki_tflare/items/42a40119d3d8e622edd2
19 Aug 2017
AI&機械学習しよう! ソース&論文輪読会(UNREAL)に出席してきました。part2 AI&機械学習しよう! ソース&論文輪読会(UNREAL)に出席してきました。 飯塚さんの「強化学習による 「Montezuma’s Revenge」への挑戦」の発表について個人的なまとめを記載します。 Montezuma’s Revengeとは DeepMindが強化学習の評価に利用するAtari2600ゲームの一つ 平均得点が人間に対し0%と強化学習における最難関ゲームの一つだった。(2016年6月まで) 得点が取れない原因 キャラが直ぐに死んでしまい、先に進めない 得点頻度が少なく、学習機会が少ない どのように対応したか A3C + Unifying Count-Based Exploration and Intrinsic Motivation + On-highscore-learningで対応 Unifying Count-Based Exploration and Intrinsic Motivation DeepMindの論文で概要は以下 ゲーム状態の頻度に基づいて、特典を与えることで報酬を与えるもの。 頻度が高い画面は得点を低くし、頻度が低い画面の得点を高くすることで、多くの画面に行くことのモチベーションを上げるもの On-highscore-learning 飯塚さんのオリジナルのアイデアで得点を得るまでの直前のステップで学習をさせるもの 他のコードも入っていたが、上記コードの効果が最大であった。 どのような結果が出たか 上記対応によりDeepMind論文未記載の部屋に到達 今後の課題・展望 現在は前処理でモノクロ化を行っているが、人間もカラーのほうが、現在場所がわかりやすいので、 カラー画像の学習も必要では 人間もマップを見ないとどの部屋にいて、どの戦略が必要かわかりにくい、AIもマップが必要では 個人的な感想 会場で話が出ていて気になったのが、機械学習では一つのハイパーパラメータですべて解決しようとすることが多いが、次のステップでは、それだけではだめで、例えばMontezuma’s Revengeの場合、部屋ごとに学習が必要ではないかという話が出ていた。 個人的に考えていたのが、Montezuma’s Revengeをクリアするにはどうすればよいのかということで、Montezuma’s Revengeにはパズル的な要素が存在するため、特定のルートを通らないとクリアできないようになっていたはず、そのため現在のスコアを追い求めるスタイルだけでは、クリアが難しいのではと感じた。 (人でもクリアにはマップを用意して実施する必要があり、同じことをやる必要があるなと考えていた。) Montezuma’s Revengeは以下により小さな子どもにはクリアが難しいゲームである。子どもの成長によりクリアできる可能性が上がってくるがその成長により得られる能力のどこが効果的に機能しているのか調べれば、ヒントが得られるかもしれないと考えている。 すぐに死ぬ等の操作が難しい パズル性が難しい。
4 Jun 2017
AI&機械学習しよう! ソース&論文輪読会(UNREAL)に出席してきました。part1 AI&機械学習しよう! ソース&論文輪読会(UNREAL)に出席してきました。 三好さんのUNREALの発表について個人的なまとめを記載します。 UNREAL 強化学習のA3CアルゴリズムをベースにExperience Replayを効果的に使った補助タスクを組み合わせて3D迷路でx10倍の高速化を実現 UNREALへの流れ DQN(2013年)→A3C(2016年)→UNREAL(2016年) A3C:複数の環境を非同期に並列で動かし高速化 UNREAL:A3CにExperience Replayを効果的に使った以下の補助タスクを導入し、さらに学習を高速化させる。 *最近はA3Cをベースとした論文が多数出ている Pixel Control Reward Prediction Value Function Replay Pixel Control 画面のピクセル値の変化を擬似報酬とする補助タスク 画面を20✕20のピクセルグリットに分け、グリット毎にQ学習を行う。 https://www.youtube.com/watch?v=xHK0qBeH3-I 上記のPCがピクセルグリットに分けたもの、 上記のPC Qがグリット毎にQ学習を実行した結果 このPixel Controlが3つの中で一番効果が高い。 個人的な感想 Pixel Controlが効果的な結果を上げているので 例えばAtari breakout(ブロック崩し)ではA3Cと比べて効果を上げるのが難しいのではないかと感じた。 Pixel Controlは情報の圧縮をしているようなもので、 breakoutは単純で、既に圧縮されているようなものなので、効果はそこまででもないのかと 逆に圧縮が効くような場合は速度に大きな効果を上げるものであると感じた。 以下は少し上記の話とは外れるが、 ゲームの上手い人は情報の圧縮の仕方がうまく、良いゲームはそれを発見させる用にできている。 例えばゲームによっては、面の背景が同じ色の場合は同じ方法論でいける箇所、面の背景が異なった色になっている場合は違う考え方をしなければいけないというサインが存在している場合がある。 面の背景色が違うというのはゲームからのヒント、ゲームの上手い人はこれをとらえ、同じ背景色の場合、前と同じ戦略が使えないか考え、違う背景色がでた場合、前と違う戦略を使わなければ行けないのか考える。しかしゲームの下手な人は違いを考えずに動き、失敗する。 これは試したことで得られた情報をいかに有効に活用し、 また活用しないかということを突き詰めれば、 現在人より劣った結果しかでていないゲームで高得点をあげられるのではと考えている。 またゲームの初期状態の教育に、転移学習を使えれば有効なのかとも考えている。
4 Jun 2017
日本初!保険金支払審査への導入で見えてきたIBM Watsonの実力 提供:日本IBM 上記を見たので、保険金支払への機械学習導入はどのような感じでできるか、少し考えてみた。 詳細な落とし込みは書いていません。 軽く考えた概要のみです。 生命保険 保険金支払をざっくりまとめると 生命保険の保険金支払はざっくりいうと以下の手順で行われる。 保険契約者の保険金請求 保険会社から保険契約者への必要書類の算出 必要書類の確認、送付依頼 保険契約者から保険会社への必要書類の送付 送られてきた書類を元に機械的な査定を実行(機械査定) 書類、機械的な査定、必要に応じた病院等への紹介などを元にした人的な査定(人的査定) 支払 機械学習を導入するとしたら人的査定のサポートに使う 機械学習を導入するとしたら3. 6の人的なサポートに用いるというのが考えられる。 保険会社がシステムで行うのが2.4.5.7 保険会社が人で行うのが3.6 現在システムで行っている箇所に機械学習を導入することで得られるメリットは少ないため(普通にロジックを組んだほうが、コストも低く、結果も固定である。機械査定へ機械学習を使用するのはどうなのか?については別途記載) 3(必要書類の確認、送付依頼)はそこまで難しくないため、それほどのメリットが得られないため、 やるとしたら6(人的な査定)になると考える。 人的査定のサポートで何ができる? 人的査定で機械学習を使うのであれば、 以前の似たような入力があった場合は支払をしていましたよ。とか 病院への確認をしていましたよ。等の表示をしてあげる。 ということしかできないだろう。 しかし、上記を行うことで人が行うとどうしても発生してしまう結果が安定しないということが改善できることが大きいと考える。 人的査定のサポートの効果は? これについては、4の機械的な査定をどの程度行っているかによって 得られるものが大幅に変わってくる。 リンク先の資料では、システム的に判定できるのが2割のシステムに導入したようだ。 「お客さまから頂く請求件数は年間約200万件あり、システム的に判定できるのは2割、残りの8割は人による判断が必要です」 このようにシステム的に判定できる割合が少なく、請求件数が多いところいには大きな価値があると考えられる。 逆にシステム投資を十分していて、システムで8割判断ができてしまえば、使えるのは残り2割となってしまい効果は薄い。 機械査定へ機械学習を使用するのはどうなのか? 人が条件を全て決めれるものであれば、機械学習を使わずプログラミングしたほうが良い結果が出る。 ただし、この条件が複雑になりだすと特に保守において問題が出始めると考えられる。 (特定の人しかいじれないものとなりその人がいなくなると保守が困難になる等) 複雑な条件となった場合は機械学習の強みが活かせるため、機械学習を行わない部分と行う部分を分け、併用することを考えるのもありと考える。
26 Feb 2017
機械学習 適用事例と実装の選択肢と機械学習系エントリ 機械学習 適用事例と実装の選択肢書きました。 機械学習 適用事例と実装の選択肢 機械学習の基本的な用語、ロボアドバイザー、AmazonGOについて、 また実装の選択肢として、機械学習ライブラリ、Microsoft Azure Machine Learning等のクラウドの利用、ネットでサービスとして提供されているサービスの利用などをまとめました。 他Qiitaで機械学習関連のエントリーを書いています。 参考にいただけますと幸いです。 ILSVRCとは何か? ILSVRCとは何か? 機械学習(深層学習)で画像関連をやってみたい場合はじめに抑えておいた方がよいものは何か 機械学習(深層学習)で画像関連をやってみたい場合はじめに抑えておいた方がよいものは何か Pythonで体験する深層学習 2章(輪講用資料) Pythonで体験する深層学習 2章(輪講用資料)
26 Jan 2017
Design pdevty