
著者:高柳 慎一, 長田怜士
監修:株式会社ホクソエム
予測精度0.001%の改善をビジネスの成果に!
「評価指標でXXXという最高のスコアが出た!」と喜び勇んで、機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが、ビジネス上のKPIと相関が高い評価指標を選んでいなかったために、KPIの推移を見てみると大した変化がありませんでした。 あるいは「毎日夜遅くまで残業をして、特徴量生成とクロスバリデーションによって評価指標を改善しました!」というデータサイエンティストがいたとします。ところが、KPIの改善のためには そこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは、データサイエンティストが費やした工数がすべて水の泡となってしまいます。———-(はじめにより)———-
このような状況が起きてしまう背景にはさまざまな原因が考えられますが、あえて一言で言うと「データサイエンスの問題が解くべきビジネスの問題と乖離していた」ためです。
機械学習モデルの”良し悪し”を決めるときには、評価指標(Evaluation Metrics)を必要とします。本質的に評価指標の設計方法は自由であり、ビジネス上の価値を考慮して自ら作成することも可能です。RMSEやAUCといったスタンダードなものから、ドメインに特化した数値まで、あらゆる指標が評価指標になりえます。では評価指標はどのように決めるのが良いのでしょうか。また、どのように決めれば冒頭のような悲しい状況を生まずに済むのでしょうか。
本書はこれらの疑問に答えるため、機械学習の良し悪しを決める評価指標を軸に、解くべきビジネスの問題をどうやってデータサイエンスの問題に落とし込むのか、その原理を解説していきます。この原理が普遍的なものであれば、ビジネスがどんなものであっても応用できると考えることができます。
回帰、分類で使用するスタンダードな評価指標についても、基本から丁寧に解説します。本書を読むことで、どのようなケースでどの評価指標を選ぶべきかがわかり、評価指標の読み間違いを避けることができます。 |
続きを読む 評価指標入門〜データサイエンスとビジネスをつなぐ架け橋 →

著者:齋藤 優太, 安井 翔太
監修:株式会社ホクソエム
(概要)
予測に基づいた広告配信や商品推薦など、ビジネス施策の個別化や高性能化のために機械学習を利用することが一般的になってきています。その一方で、多くの機械学習エンジニアやデータサイエンティストが、手元のデータに対して良い精度を発揮する予測モデルを得たにもかかわらず、実際のビジネス現場では望ましい結果を得られないという厄介で不可解な現象に直面しています。実はこの問題は、機械学習の実践において本来必要なはずのステップを無視してしまうことに起因すると考えられます。機械学習を用いてビジネス施策をデザインする際に本来踏むべき手順を無視して予測精度の改善だけを追い求めると、「解くべき問題の誤設定」や「バイアス」といった落とし穴に気づかぬうちにハマってしまうのです。
この問題を解決するためには、機械学習のビジネス応用において必要となる前提条件を着実にクリアしなくてはなりません。しかし多くの現場では、「学習」や「予測精度」などに関する手法やテクニックのみに注目してしまう傾向があり、「機械学習にどのような問題を解かせるべきなのか」「実環境と観測データの間の乖離(バイアス)の問題にどのように対処すべきか」といった効果的なビジネス施策をデザインするために重要な観点が軽視されがちです。機械学習をビジネス施策に活かすための前提が整えられていないにもかかわらず、発展知識を身に付けたり論文の内容をそのまま実装したところで、望ましい結果を継続的に得ることは難しいのです。
本書では、ビジネス施策を自らの手で導くために必要な汎用的な考え方を身につけることを目指します。そのため本書ではまず、機械学習をビジネス現場で活用する際に本来踏まねばならないステップを明文化した汎用フレームワークを導入します。そしてその汎用フレームワークを活用しながら、効果的な施策を自らの手で導出する「施策デザイン」の流れを繰り返し体験します。これまで軽視されてきた「機械学習の威力を担保するために必要な前提のステップ」をフレームワークとして明文化し、データから施策を導くプロセスを自らデザインするという斬新なコンセプトで、ビジネスにおける変幻自在/臨機応変な機械学習の応用を可能にすることが、本書の最終目標です。(こんな方におすすめ)
・ 機械学習エンジニア
・ データサイエンティスト
・機械学習エンジニア、データサイエンティスト職を志望する学生(目次)
1章 機械学習実践のためのフレームワーク
1.1 機械学習の実践に潜む落とし穴
1.2 機械学習実践のためのフレームワーク
1.3 本章のまとめ
1.4 参考文献
2章 機械学習実践のための基礎技術
2.1 正確な予測を導く
2.2 高性能な意思決定を導く
2.3 Open Bandit Pipelineを用いた実装
2.4 本章のまとめと発展的な内容の紹介
2.5 参考文献
3章 Explicit Feedbackを用いた推薦システム構築の実践
3.1:Explicit Feedbackを用いた推薦システムの構築
3.2 推薦システムの標準的な定式化と手法
3.3 推薦システムに潜むバイアスの問題
3.4 フレームワークに則った推薦システム構築手順の導出
3.5 Pythonによる実装とYahoo! R3データを用いた性能検証
3.6 本章のまとめと発展的な内容の紹介
3.7 参考文献
4章 Implicit Feedbackを用いた推薦システムの構築
4.1 標準的なランキング学習の枠組み
4.2 フレームワークに則ったランキングシステムの学習
4.3 PyTorchを用いた実装と簡易実験
4.4 本章のまとめと発展的な内容の紹介
4.5 次章に向けて
4.6 省略した計算過程
4.7 参考文献
5章 因果効果を考慮したランキングシステムの構築
5.1:本章で扱う発展的な話題
5.2 推薦枠経由で観測される目的変数を最大化する
5.3 プラットフォーム全体で観測される目的変数を最大化する
5.5 本章のまとめと発展的な内容の紹介
5.6 参考文献
付録A 演習問題 |
続きを読む 施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方 →

著者:渡邉 克彦
トヨタ流のデータ分析を学べる
本書は、長年トヨタおよびトヨタグループで困り事解決の実践支援に携わった著者が、統計的品質管理(SQC)と機械学習というデータ分析手法のより良い使い方を解説したものである。
本書で、従来のデータ分析手法「統計的品質管理(SQC)」と、近年脚光を浴びている「機械学習」それぞれの得意とするところを理解でき、これらを上手に実務へ活用できるようになる。
著者について
東京理科大学基礎工学研究科修士課程修了。トヨタ自動車(株)第3電子技術部に入社。その後、TQM推進部、SQCグループのグループ長として応答曲面法、信頼性、品質工学、感性評価などの社内講座における質向上の取組みを行う。現在は、SQCおよび機械学習におけるデータ分析の普及推進や実践活用の支援に従事。 社内およびトヨタグループのデータ分析推進・ 指導アドバイザ。日本規格協会講師、中部品質管理協会講師。 |
続きを読む 上手な機械学習と統計的品質管理の使い方入門 →

著者:藤原 幸一
スモールなデータの解析手法・ノウハウが身につく!
《内容紹介》
Webデータや画像データに代表されるようなビッグデータが注目される一方で、機械の故障データのように発生自体がまれであったり、患者さんの検査データのように倫理的な問題からデータを集めることに制約があったり、あるいはデータの判読が専門家以外では困難で機械学習に利用しにくいデータは、どうしても忘れられがちです。ビッグデータの時代において、収集が難しいために私たちが忘れかけているデータのことをスモールデータとよびます。
スモールデータでは、測定されている変数の数に比べて学習に必要なサンプルが不足していたり、それぞれのクラスのサンプル数が極端に偏っていたりするため、深層学習のようなビッグデータの方法をそのまま適用するのは適当ではなく、異なるアプローチが必要になります。
本書は、スモールデータとはどのようなデータであるのかを具体的に紹介して、スモールデータ解析の基本となる次元削減と回帰分析を説明します。特に部分的最小二乗法(PLS)はスモールデータ解析の大きな武器となるでしょう。そして、機械学習においてモデルの性能向上のために必要な変数(特徴)選択を紹介し、特にクラスタリングに基づいた新しい変数選択手法を説明します。つづいて、不均衡なデータの解析手法と異常検知を紹介して、最後にスモールデータ解析についての筆者の経験に基づいたポイント・考え方を述べました。本書ではPythonプログラムとスモールデータ解析の例題を通じて、読者がスモールデータを有効に解析できるようになるよう工夫しています。
ビッグデータの世界は、もはやデータ量と資本力が支配するレッドオーシャンとなっています。しかし、スモールデータの世界は、まだまだ現場の創意工夫次第でデータから新たな価値を引き出すことのできるブルーオーシャンなのです。みなさんも、この未知の世界に飛び込んでみませんか? |
続きを読む スモールデータ解析と機械学習 →

著者:松本 健太郎
話題のデータサイエンティストが解き明かした、大ヒット&大ブームの「悪魔の法則」…人間の50%はクズである!「キレイごと」より「本音トーク」がウケる理由、「メガ盛り」が食べたいのに「サラダ」が欲しいと嘘をつく心理、人々を新型コロナ論争に駆り立てるバイアス…。「つい、買わされてしまう…」禁断のテクニックを解説! |
めちゃくちゃ腹落ちしますね。これこそがデータサイエンティストの醍醐味だと思います。私も長年BtoCでのデータマイニング~データサイエンスをやっていますが、よく面接でもデータサイエンティストとして応募があるのですが、ここが分かってないとBtoCのデータサイエンティストとしては難しいという観点で厳しく見てしまっています。
実例について、行動経済学の要素をうまく絡めながら説明してくれています。BtoCマーケティングをしていくうえで、そしてそれを下支えするデータアナリシス、データサイエンスとして忘れてはならない大事なポイントが列挙されています。Kaggleなどのデータコンペで設定された課題の精度を上げるということも大切ですが、この洞察力がないと実務では役に立たないと思っています。
続きを読む 人は悪魔に熱狂する 悪と欲望の行動経済学 →
著者:原田将嗣、監修:石井遼介
ちょっとした言葉の言い換えで、聞いている人の感じ方も大きく変わってくるというのが、自分が言われた身になって考えるとすごくよくわかる言葉の数々です。
大きく4つの観点が書かれています。
それは、「話助挑新」です。
・話しやすさ:ちょっといま、いいですか?
・助け合い:何かサポートできる?
・挑戦:まずはやってみよう!
・新奇歓迎:その視点はなかった!
この4つの観点で、55の言い換えが載っています。
続きを読む 心理的安全性をつくる言葉55 →
著者:イ・ミンギュ
「すぐやる人」になる20の方法が書かれています。それらを紹介します。
続きを読む 「後回し」にしない技術 →

著者:ニック・ウィリアムソン
著者について
ニック・ウィリアムソン(Nic Williamson)
英会話教室「ニック式英会話」主宰。
同名のYouTubeチャンネルは登録者数29万人を超え、人気を博している。
オーストラリアのシドニー出身。シドニー大学で心理学を専攻。同大学で3年間日本文学も勉強し、日本の文化にも明るい。在学中にオーストラリアの日本大使館が主催する全豪日本語弁論大会で優勝。日本の文部科学省の奨学金を得てシドニー大学卒業後、東京学芸大学に研究生として1年半在学。在学中にアルバイトとして英会話スクールで英語を教え始め、卒業後も看板講師として勤め上げる。英語講師として20年間のキャリアの中で、英会話教室をはじめ、企業向け英語研修や大学の講義、SKYPerfecTVの番組の司会やラジオのDJ、数々の雑誌のコラムや8冊の英語本の執筆など、活動の場は幅広い。ゼロから日本語を完璧に習得した経験と、大学で専攻していた神経心理学の知識をもとに、非常に効果的で効率的な独自の言語習得法を開発。著書に『たった30パターンで英会話! 「言いたいことが出てこない」をスッキリ解消』『中学レベルの英単語でネイティブとペラペラ話せる本』『中学レベルの英単語でネイティブとサクサク話せる本[会話力編]』(以上、ダイヤモンド社)、『旅の英会話伝わるフレーズ集』(ナツメ社)など。 |
新聞広告で見かけ、気にはなっておりましたが、書店でも平積みされており手に取って見てみました。
英語の論文は読まないといけないので、英語には接しているものの、「話す」はハードルが高いんですよね。まぁ、典型的な受験英語経由なので。
ところが、、、、この本の内容、もしかしたらブレイクスルーできるかもしれません。
続きを読む A4一枚英語勉強法 見るだけで英語ペラペラになる →

著者:博報堂生活総合研究所,堀 宏史,酒井 崇匡,佐藤 るみこ
著者について
博報堂生活総合研究所
1981年、「生活者発想」を標榜・実践する博報堂のフラッグシップ機関として設立。人を消費者だけにとどまらない多面的な存在:「生活者」として捉え、独自の視点と手法で研究している世界でも類を見ないシンクタンク。主な活動として、生活者の変化を長期にわたって追う時系列調査や生活者と暮らしの未来の予見・洞察などに加え、近年はデジタル空間上のビッグデータをエスノグラフィの視点で分析する『デジノグラフィ』の研究も推進中。その成果は書籍はもちろん発表イベントやWebサイトを通じて広く社会に発信している。 |
続きを読む デジノグラフィ インサイト発見のためのビッグデータ分析 →

著者:世界文化社
Woven Cityの地鎮祭が去る2月23日(富士山の日)に行われましたが、そのタイミングで出された「トヨタイムズ」初のムック版。
続きを読む トヨタイムズmagazine 豊田章男は2020年、何を考えどうしたか? →
Adventure and Innovation! Amazing Quest!