著者:デイヴィッド・シュピーゲルハルター
英国ベストセラー! 元・英国統計学会会長による統計学入門書の最新決定版。 旧来の統計学の教え方・学び方を刷新! 数式は最小限。図表70点余、興味深い実例は満載。「統計学の国宝」(ジェレミー・ヴァイン/BBCラジオ2) 「政治家、ジャーナリスト、医者、そして統計によって人々に影響を与えようとする(あるいは影響を受ける)すべての人の必読書」(ポピュラー・サイエンス誌)英国で異例のベストセラーとなった統計学入門書が、ついに邦訳! 数式は、本当に必要最小限。データサイエンス時代に対応するため、旧来の統計学の教え方・学び方を刷新。図表70点あまりを利用し、興味深く具体的な実例で教えることで、そのわかりやすさ、面白さに多くの人が驚いた必読の一冊! 統計学入門書、最新決定版。 〔内容より〕 |
この書籍は、データサイエンティストにもおすすめの一冊です。私もデータマイニング~データサイエンスと長くこの分野に従事していますが、この書籍の内容を知っているのと知らないのとでは大きな違いが出てくると言えるほど、内容が濃いです。
最後に用語集がついているのですが、これがまた秀逸でこれだけでも意味があるのではと思うくらいです。
備忘のために、「おわりに」に記載されている”効率的な統計実務の10か条”を記載しておきます。これも経験者ほど刺さるポイントではないかと思います。
- 統計学的手法は、データを元にして科学的疑問への答えを出せるものではない
どの手法を使うのかに焦点を当てるのではなく、「なぜこれをするのか」を問いなさい - シグナルは必ずノイズを伴う
この2つを分離しようとする試みが、このテーマを興味深いものにしている。ばらつきは避けられないし、確率モデルは抽象化するのに有効だ。 - とにかく先行して計画を立てる
たとえば、検証的試験の際に事前に手順を確定させておくという考え方がそうだ。研究者に自由度を持たせない。 - データの質を気にかける
あらゆる事柄はデータに根差している。 - 統計分析は計算法の集合以上のものである
なぜそのようなことをするのかを知らずに、ただ数式に突っ込んだり、ソフトウェアの手順を実行したりしてはならない - あくまで簡潔に
主要な伝達事項はできるだけ必要最小限にすべきだ。本当に必要になるまでは複雑なモデリングのスキルを見せつけない。 - ばらつきの評価を提示すること
許容誤差は主張されているよりもたいがい大きいという点にも注意する。 - 自分が置いている仮定を確認すること
そして、仮定が確認できなかった場合は、そのことを明確にする。 - 可能なら、再実験する!
あるいは再実験をほかの人に促す。 - 分析を再現可能にする
自分のデータとコードにほかの人がアクセスできるべきだ。