事例+演習で学ぶ機械学習


事例+演習で学ぶ機械学習 ビジネスを支えるデータ活用のしくみ

事例+演習で学ぶ機械学習 -ビジネスを支えるデータ活用のしくみ
著者:速水 悟

内容紹介
「機械学習はどのような場面で使われているのか?」
「実際に使われているシステムはどのようなしくみになっているのか?」
本書は,こういった疑問に答えつつ,機械学習の基本的な手法を学べる入門書です.◇本書の特長
・「部屋の賃料」「顧客の分類」といった身近な話題を用いて,線形識別や決定木などの基本的な手法について解説します.
・「Netflixによる映画の評価予測コンテスト」「Suicaやクレジットカードの使用履歴からどの程度個人の特定ができるか」など,機械学習とかかわりの深い研究やビジネスの事例について紹介します.
・Amazonなどで利用されている,「購入履歴から個人の好みを判断し,商品を紹介するシステム」「検索に連動したWeb広告」のしくみについて,章を割いて詳しく解説します.なお,付録にあるRのサンプルコードは,森北出版のWebサイトにて公開しています.

★読書前のaffirmation!
[きっかけ・経緯] 副題のビジネスを支える「データ活用のしくみ」に惹かれました。マーケティング的には、この副題を主題にしたほうが売れるように思いますが、さて内容のほうは如何に。
[目的・質問] 「データ活用のしくみ」を学びます。
[分類] 007.1:情報理論, 数字(情報科学)

データ活用にかかわる変化として、
①オンラインビジネスの台頭
②情報インフラ(基盤)の発展
③分析手法のオープン化
④ストリームデータの増加
を挙げています。(pp.1-5)

データマイニングの例として、CiscoSystemsの「顧客企業の分類」の事例が載っています。顧客企業を下記のようなカテゴリーに分けて、会計年度間の変化を分析したとのこと。

・金脈顧客(自社に対する支出:大、IT予算:大)
・ジャックポット顧客(自社に対する支出:小、IT予算:大)
・ドングリ顧客(自社に対する支出:大、IT予算:小)
・レモン顧客(自社に対する支出:小、IT予算:小)
・売上ゼロの企業

カテゴリーの組み合わせごとの売上の上昇・減少を調べ、新規の顧客を獲得することが売上の上昇に大きく寄与していることと、ジャックポット顧客の潜在的な可能性を十分に売上に繋げられていないことが分かったようです。

またBT(British Telecom)においても、中小企業顧客に対して、①現在の売上高、②リスク傾向、③BTとの関係性、④BT外の総売上高の4つの要素から分類した事例が紹介されています。この観点で、150社あまりの中小企業顧客を次の6つのセグメントに分類して、それぞれのセグメントに向けた戦略を立案できるようになりました。

  • 第1セグメント:非常に大きなチャンスがあり、関係も深い
  • 第2セグメント:売上増に大きなチャンスがあり、関係も深い
  • 第3セグメント:大きなチャンス、潜在的売上増は中程度で、関係は浅い
  • 第4セグメント:現時点では大きなチャンス、成長の可能性と関係は浅い
  • 第5セグメント:チャンスは小、売上増の可能性も限定的、関係は中
  • 第6セグメント:チャンス、成長の可能性ともに小さく関係も浅い

これらの分析では、他社との比較による相対的な評価や、前年度との変化をセグメント化のために用いるている点がポイントとのこと。(pp.15-16)

機械学習とデータマイニングとの違いは、モデルが試行錯誤を含む探索的な分析だけでなく、自動的な処理にも用いられる点です。機械学習を用いた自動的な処理というのは、分析結果を人間が解釈して次の行動に繋げるのでなく、オンラインビジネスなどで学習によって得られたモデルを、自動化されたシステムの中で利用することです。探索的な分析が性的否利用であるのに対して、自動的な処理は動的な利用と言えます。(p.17)

機械学習が適用されるタスクとして、下記の分類がされています。

教師あり学習 ①識別(クラス分類)
②予測
教師なし学習 ①クラスタリング
②次元圧縮

さて、次にテキストマイニングについて書かれています。

テキストマイニングから得られる知見は、広くは顧客と開発者やサービス提供者との間のコミュニケーションを向上させます。大量のデータを、人手でなく情報システムによって分析することで、次の例に示すような可能性が生まれます。

  • 顧客の声にタイムリーに応えることによってビジネスのスピードが向上する
  • 分析結果を共有することによって担当者のスキルが向上する
  • 製品やサービスの新しい特徴を顧客がどのように支持しているかを知る
  • 想定外の利用者や利用シーンに気づくことによって潜在的なニーズを発掘する

新しい特徴をもった製品やサービスの売上が増加すれば、顧客から支持されていることは分かりますが、それがどのように支持されているかや、想定外の利用者、利用シーンに関する情報は、顧客の声を集めて分析することから得られます。(p.90)

これらの事例をRで実施できるような参考説明が最後にされています。

 

結局、ちょっとした事例だけでしたので、「ビジネスを支えるデータ活用のしくみ」と言うことに対しては、少し無理があるように思いました。

 

(気に入ったら投票をお願いします!)

にほんブログ村 経営ブログへ
にほんブログ村

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください