前処理大全


前処理大全[データ分析のためのSQL/R/Python実践テクニック]

著者:本橋 智光

サブタイトルに「データ分析のためのSQL/R/Python実践テクニック」ということなのですが、非常にマニアックな内容でなかなか売れないと思いますが、分かる人には分かる目からウロコの内容です。(Inobe.Shion)

File:Mei, Bernardino - Christ Cleansing the Temple - c. 1655.jpg

内容紹介

Law of Awesome Data Scientist

データサイエンスの現場において、その業務は「前処理」と呼ばれるデータの整形に
90%以上の時間を費やすと言われています。
「前処理」を効率よくこなすことで、予測モデルの構築やデータモデリングといった
本来のデータサイエンス業務に時間を割くことができるわけです。

本書はデータサイエンスに取り組む上で欠かせない
「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。
ほとんどの問題についてR、Python、SQLを用いた実装方法を紹介しますので、
複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。

出版社からのコメント

前処理が適切に行われているかどうかで、データ分析の品質は左右されます。
本書でさまざまな前処理のテクニックを身に付けてください。

R、Python・・・そしてSQLまで入れているところが本格的です。それほど大きくないデータでスト、Rや、Pythonでもいいと思うのですが、BigDataの場合は、データベースと直接連携することが多いでしょうから、SQLまで扱っていることはさすがよくわかってらっしゃるという感じです。

内容も、たとえば欠損地にk-NNで補完するとか本当に分析で苦労されて導き出したテクニックもあり、学ぶところは多いです。

是非、手元に置いておいて損のない本だと思います。

にほんブログ村 経営ブログへ
にほんブログ村

(気に入ったら投票をお願いします!)

 

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください