グーグルに学ぶディープラーニング

グーグルに学ぶディープラーニング
著者：日経ビッグデータ

内容紹介
ディープラーニングは、人工知能や機械学習と何が違う?
この技術によって将来、ビジネスはどう変化する?
グーグルのエンジニアらへの取材に基づき、
その技術をやさしく解説するとともに
最新の事例から、将来のビジネスの変化を探る1冊。囲碁のプロ棋士に勝つ、クイズのチャンピオンに勝つ──、人工知能(AI)はこうした特定分野で象徴的な成果を上げてきました。
しかし、最近ではAIが人々の生活や経済活動を改善して、世の中を変えていく可能性を示す実例が次々と出てきました。例えば、米グーグルは、AIを使った「Google翻訳」の精度を大きく改善し、長年「実用的ではない」と言われてきた機械翻訳を日常
生活では十分実用的なレベルへと引き上げました。また、同社はデータセンターにおけるサーバーなどの冷却電力を40%も削減しました
これもAIを活用して空調や窓の調節・開閉など約120の要素を制御し最適化した成果です。大手IT企業は次々と画像認識、音声認識、
翻訳といったAI機能を安価に提供し始めており、いわば「蛇口をひねればAIがすぐ使える」時代が間もなく到来します。このAIの進化をけん引するのが、脳の神経回路が仕組みの原点にある「ディープラーニング」という技術です。本書では、グーグル
のエンジニアらへの取材に基づき、このディープラーニング技術をやさしく解説。また、将来のビジネスがどう変わるのか、グーグルの
サービスや日本企業の取り組み事例から探るとともに、その未来の姿に迫ります。<主な内容>
序章ディープラーニングがすべてのビジネスを変える
第1章 <超入門>人工知能と機械学習とディープラーニングはどう違う?
第2章 <入門>ディープラーニングの仕組み
第3章 <グーグル事例編>グーグルのディープラーニング活用事例
第4章 <企業事例編>ディープラーニングで業務効率化、国内で続々始まる
第5章 <活用フレームワーク編>データ×目的で整理し、活用の展開図を描こう
第6章 <将来展望編>ディープラーニングが課題を解決する未来へ
グーグルクラウド・マシンラーニング・グループ研究責任者のジア・リーさんに聞く

★読書前のaffirmation！
[きっかけ・経緯] ディープラーニングの活用分野を知る。
[目的・質問]　分析の人はどんどん増えてくるでしょうけど、この分野にディープラーニングが適応できるということに気づけるか、気づけないか、そこがポイントだと思っているのですが、それについてどういった見解なのかを知りたいと思っています。
[分類]　007.1：情報理論, 数字（情報科学）

機械学習以外の人工知能ということで下記が紹介されています。

機械学習の人工知能も、実はすでにさまざまなところで利用されています。その代表的な方式が、世の中の出来事を論路式で書き出すというものです。「雨が降ると地面が濡れる」といった関係を論理的に推論することで、すべての現象を導き出そうとするんですね。たとえば、「AならばB」という関係を積み重ねて、その推論の結果としてゴールを見つけます。数字の証明などは、コンピュータの助けを借りないとできないのですが、ここでは「AならばB」を積み重ねた人工知能の推論が有効に使われています。この場合、人間が「AならばB」という関係をコンピュータに教えるので、機械学習ではありません。この他に、ゴールを定めておいて、ゴールを達成するには「その前に何をする必要があるか？」という複数のサブゴールを用意していく「プランニング」もあります。ロボットなどへの応用で、目的の動きをさせるために、何をすればよいかを人工知能が考えるといったときに使うことができます。（p.45）

また、特定の分野に限って人工知能の力を借りる「エキスパートシステム」もあります。人工知能はすべての知的なことを解釈しようと考えるわけですが、それは事実から推論したり計画法でゴールから遡って考えたりしても、なかなか実現が難しいわけです。それならば、分野を限って人工知能の力を最大限に発揮しようと考えたのがエキスパートシステムです。（pp.45-46）

機械学習で扱われるモデルには、多くの種類があります。「決定木」「帰納推論」「ニューラルネットワーク」「ディープラーニング」などが代表的なものです。・・・「帰納推論」というのは、少し決定木とは異なる考え方です。条件分岐で記述するのではなく、「AならばB」「BならばC」といった論理式で記述します。モデルは論理式の集合になるわけです。（pp.49‐50）

ディープラーニングは、深層学習ということもあります。層が深い学習をするわけです。これはニューラルネットワークの構造と併せて考えてみましょう。ニューラルネットワークの典型的な構造では、入力層、中間層、出力層の3層構造をとっていました。これでは、複雑な情報を処理するのが難しそうなことは、素人目にもわかります。そこで、中間層を多層化することを検討します。それがディープラーニングです。深層学習とも呼びます。数十や100を超えるほど多層化したノードを構成し、大量のデータを使って機械学習することで、ニューラルネットワークが実際に利用可能な答えを導き出すようになってきたのです。（pp.53-54）

ニューラルネットワークとディープラーニングを理解する際のポイントを整理しておきましょう。（p.64）

ニューラルネットでは、お手本データをたくさん読み込むことで、間違いが少なくなるようにニューロン間の関係を示す値を調整しながら学習します。
データが複雑になるほど、多くの層のニューラルネットが必要になります。
最大のポイントは人間がプログラムして動くのではなく、コンピュータが自らの特徴を見つけ出すことです。

ここで見ているようなニューラルネットや、多層で学習するディープラーニングは、人間が「答え」を教えることはありますが、人間は「解き方」を教えません。

人間が解き方を教えるとなると、最大でもその解き方を教えた人間のレベルまでの仕事しかできないわけです。しかし、コンピュータが自分で解き方を考えると、人間を超える可能性も出てくることになります。与えられたデータから、人間では考えもつかなかったような答えを導き出すこともあるのです。（p.65）

対して、「教師なし学習」という手法もあります。「強化学習」は、この教師なし学習の一種といえます。今の状態から次の状態に変わるときに、何が正解かその時点ではわからないケースがあります。例えばゲームの一手では、その時点でよい手だと判断したとしても、ゲームの勝敗が決まらないと「最終的な正解」が見えてきません。自動運転を考えてもよいでしょう。自動運転では、ぶつからないで目的地まで運転することが最終的な正解であり、現時点の次の操作としてアクセルを踏むかブレーキを踏むか、ハンドルを回すのかーといったことはその時点で正解が得られないのです。・・・「例えばボードゲームの場合、似たような盤面で次の手としてある特定の手を指したとき、この手では勝ちが多かった、こっちは負けが多かったということは、ゴールまで到達してみてようやくわかるものです。1回1回の手に正解のデータがあるのではないのだけれど、最終的にいいいことがある、すなわち報酬が得られる場合に、その報酬をフィードバックすることで学習させるのです。これを繰り返す学習の方法を、強化学習といいます」（pp.66-67）

ディープマインドは、ディープラーニングを活用してアルファ碁を作りました。アルファ碁では、ディープラーニングと乱数を使ったシミュレーションで統計的に答えを導き出す「モンテカルロ木探索」という手法を組み合わせました。モンテカルロ木探索は、ゲーム用の人工知能でよく使われる方法です。アルファ碁は、囲碁の盤面（19 X 19）の状態をそのままディープラーニングの入力として、数百万ノードで構成された12層のニューラルネットで処理をします。ニューラルネットには2種類あり、1つが「次の指し手」を決める「ポリシーネットワーク」、もう一つが勝率を計算し勝者を予測する「バリューネットワーク」です。ポリシーネットワークでは、指し手を探索するは範囲を狭めていることが特徴です。一方、バリューネットワークでは、探索の深さを狭めています。（pp.69-70）

グーグルでは、ディープラーニングの技術をデータセンターの省エネに活用するという取り組むにも成功しています。ディープラーニングと省エネというと、少し関係が遠いように感じますが、ディープラーニングの応用範囲の広さを感じられる事例です。データセンターの省エネにも、アルファ碁などと同様に、ディープマインドのディープラーニング技術を活用したものです。データセンターでは、設備が稼働している状態や、外部の気候などに応じて冷却設備の設定を最適化できれば、冷却設備の消費電力を少なくすることができます。この最適化にディープラーニングを用いたのです。具体的にはデータセンター内に数千におよぶセンサーを取り付け、温度、電源、ポンプ速度、各種の設定といった情報を収集します。これらのデータと、データセンターの消費電力および電力使用効率（PUE)の間にある関係をニューラルネットワークに学習させました。（p.86）

グーグルは、誰にでも使える機械学習サービスを提供しています。グーグル内で閉じるのではなく、多くのお客様に機械学習の先端の成果を使っていただけるようにしています。そこでは、大きく分けて2種類のサービスを要ししています。１つが機会学習の訓練済みモデルを、APIとして提供する形です。もう1つが、機械学習ライブラリの「テンソルフロー（TensorFlow）の提供です。（p.114）

●グーグルが提供する4種類の機械学習API（p.115）

１	Cloud Vision API	画像から有用な情報を引き出す
２	Speech API	音声からテキストに変換
３	Natural Language API	非構造化テキストからインサイトを得る
４	Translate API	数千の言語ペアを動的に翻訳

実際にディープラーニングのプロジェクトを進めるとなると、企業で検討プロジェクトチームをつくり、社内のデータの整備や課題の洗い出しを進めることになるでしょう。その際に、どんな人材が必要か。

ビジネスの旗振り役
ディープラーニングの技術者、データサイエンティスト
モデルを組み込んだシステムを作るエンジニア
ビジネスとエンジニア、データサイエンティストの橋渡し役

4の橋渡し役が既存の組織にはない、一方で重要な役割を果たす人です。「エンジニアと人工知能の技術を理解しながらビジネスとつないでいく人がいないと、今後業務が回っていかないのではないかと懸念しています」と下田さんは指摘します。橋渡し役を担う人材は、ビジネスに取り組む人が技術力を身につけるのは大変なので、ディープラーニングの技術者やエンジニアが活用に興味を持ち、美辞ニスにも向き合うことが良いのではないかということです。（p.168）

そうなんですよね。この『4』の重要性が分かっている人が少ないです。この役割が不在のままプロジェクトを進め、うまくいかない原因がよく分からないままプロジェクトが路頭に迷う・・・そんな話が多くなってくるような気がします。個人的には、ここがホントにコアで問題点の本質を分かっていないとできないと思ってまして、外注さんに任せてはいけないところだと思うんですけどね。こちらには、支援企業に頼ることも多くなってくるって書かれてますが・・・どうなのかなぁと思いますね。

(気に入ったら投票をお願いします!)