データ分析プロジェクトの手引
: データの前処理から予測モデルの運用までを俯瞰する20章
著者:D. ネトルトン
内容紹介 ビジネスにおけるデータ分析の重要性が叫ばれるようになって久しい。さらに最近ではビッグデータに注目が集るようになり,データ分析の需要は高まる一方である。本書はビジネスにおけるデータ分析を,その要件定義から分析システムの構築に至るまで,豊富な事例を紹介しつつ詳述した解説書である。 前半は,ビジネスで分析を進める際の要件定義から始まり,データの集め方,集めたデータの前処理の方法,そしてデータマイニング・機械学習の手法を用いた分析結果の解釈・レポーティングについて解説している。後半は事例紹介を交えつつ,テキストマイニング,データベースとの連携,プライバシーへの配慮といった発展的な話題で構成されている。 本書を通じて,読者はビジネスにおいてどのようにデータを集めて分析し,システムとして確立していくかについて学ぶことができる。企業におけるデータ分析のあり方を学びたい初心者はもちろんのこと,企業の第一線で分析を手掛けてきた分析者が,マネージャクラスとして新たな道に進む際に,自分の知識を再確認するためにも有用である。 [原著:David Nettleton, Commercial Data Mining: Processing, Analysis and Modeling for Predictive Analytics Projects, Elsevier, 2014.] |
★読書前のaffirmation!
[きっかけ・経緯]
[目的・質問]
[分類] 336.1:経営政策.経営計画
原題は「Commercial Data Mining」、IBMでビジネスインテリジェンス関連で、さまざまな分析プロジェクトに関与された方が著者です。
ビジネスデータ分析プロジェクトは、その開始時点で分析目的の定義に十分な時間を費やすべきである。(p.9) |
具体的には次の3つの観点が考えられる。
①精度と改善度を目標にする
(例)既存顧客に対する製品のクロスセリングを5%上げる
②データモデルに対して期待する精度
(例)どのクライアントが新製品に契約するか75%の確率で予測する
③期待する改善度
(例)新しい顧客セグメンテーションモデルを生み出す
このあたりから始まって、基本的な内容が網羅されています。
さすがに、私も20年以上データ分析をやっていましたので、ここから学ぶことはほとんどなく、まさに初めてデータ分析を始めようとされている方向けの著作だと言えるでしょう。