ビッグデータ分析・活用のためのSQLレシピ

ビッグデータ分析・活用のためのSQLレシピ

ビッグデータ分析・活用のためのSQLレシピ
著者:加嵜 長門,田宮 直人

内容紹介
ビッグデータ時代のSQL活用術・レシピ集本書は、著者が普段の業務で実際に作成しているレポートやSQLのコードをより汎用化し、レシピ集としてまとめたものです。「データの加工」「売上の把握」「ユーザーの把握」「Webサイト内のユーザー行動の把握」「異常値の検出」「検索機能の評価」「レコメンド」など、具体的なシーン別に、実践的な手法とノウハウを解説しています。

●読者対象
本書では、アクセス解析等を担当する社内の分析担当者と、実装を行うエンジニアの双方を対象として、下記の情報を提示します。
・データ加工の手法
・分析に使用するSQL
・レポーティング・分析の手法
分析担当者であれば、アクセス解析ツールが提供する指標やフィルタがなくても、それ以上のことを自らで実践できるようになること、エンジニアであれば、分析業務を十分に理解して、分析担当者や経営層に対して、適切な情報提供やレポート提出、そして助言できるようになることを、目指しています。

●構成
1 ビッグデータ時代に求められる分析力とは
2 本書で扱うツールとデータ群
3 データ加工のためのSQL
4 売上を把握するためのデータ抽出
5 ユーザーを把握するためのデータ抽出
6 Webサイトでの行動を把握するためのデータ抽出
7 データ活用の精度を高めるための分析術
8 データを武器にするための分析術
9 知識に留めず行動を起こす

Chapter1~2は導入部で、Chapter1は基本を解説し、Chapter2で本書で扱うデータやミドルウェアについて説明しています。
Chapter3~8では、具体的なSQLを用いたコード例とともに、ビッグデータ活用の手法について紹介します。
Chapter3では基礎的なSQLの記述やデータ加工の手法について解説し、続くChapter4~8でデータ活用における具体的なシーン別に実践的な「分析手法」と「SQL」を解説しています。
Chapter9ではまとめとして、本書の提供する内容が知識で留まらないよう、データの活用の事例やヒントを紹介します。

●本書で扱うミドルウェア
PostgreSQL、Apache Hive、Amazon Redshift、Google BigQuery、SparkSQLで動作確認を行っています。

内容(「BOOK」データベースより)
「ビッグデータ時代」のSQL活用術・レシピ集!

★読書前のaffirmation!
[きっかけ・経緯]
[目的・質問]
[分類] 007.6:データ処理 情報処理

非常におもしろい。分析者はデータベース(SQL)を勉強しなさい、そしてエンジニアは分析を勉強しなさいと。両者が守備範囲を広げないと、今後は成果を出せないと。

私の場合、まさにここに書かれているようなことを体現しておりますので、特に何も言うことはなく、逆にこういう本を書きたかった・・・という感じでした。

SQLも単なる文法だけでなく、分析を進めながらの進行となるので、非常に興味深く読めると思います。

一度、書店でご確認ください。

▼SQL関数の復習
COALESCE関数:NULL値を任意の値に置き換える。
CONCAT関数:文字列を結合させる、||と同じ。
greatest関数, least関数:greatest(a,b,c,d) →a,b,c,dのうち最大のモノ
SIGN関数:符号を求める。
・number > 0のとき: 1
・number = 0のとき: 0
・number < 0のとき: -1
power関数:累乗

(気に入ったら投票をお願いします!)

にほんブログ村 経営ブログへ
にほんブログ村

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください