<b>現実的な分析手法とは?</b>
本書ではSQLを使った分析の手法、そしてそのためのシステムの構築についてお話しします。
なぜならば、SQLは企業において現実的に実現可能な中で最も制約の少ない分析手法だからです。
現実的にギリギリ可能な範囲で、でもできるだけ楽をしたい。
本書はそんな現実的で、しかしよくばりな要望に対して、SQLという解で答えます。
ビジネスに役立つ分析を行いたいプランナーも、ビッグデータをどうにかしたいエンジニアも、みんなまとめて面倒みましょう。
第1部 SQLによるデータ分析
第1章 10年戦えるデータ分析の技術
第2章 さわってみようRDBMS
第3章 簡単! select文でデータ探索
第4章 すべての分析は集計から始まる
第5章 関数で自由自在に新しいカラムを作り出す
第6章 ジョインを制するものはRDBMSを制す――基礎編
第7章 ジョインを制するものはRDBMSを制す――応用編
第8章 遅れて来た分析SQL最強の武器――ウィンドウ関数
第9章 縦と横は難しい
第10章 アクセスログのセッション分析をする
第2部 分析システムの構築
第11章 10年戦えるデータ分析システム
第12章 ビッグデータに立ち向かう
第13章 SQLバッチの技法
第14章 本書を読み終えた後に
【まえがき抜粋】
本書ではSQLを使った分析の手法を解説します。
またSQLを使った分析を可能にするシステムの構築についても話します。
なぜならば、SQLは企業において現実的に実現可能な中で最も制約の少ない分析手法だからです。
「現実的に実現可能な中で」「最も制約の少ない」……とはなかなか面倒な言いかたですね。
ですがこれが本書を最も適切に表現した一言なのです。
当然ながら、何事も余計な制約はないほうがいいに決まっています。
手計算にExcel、R、Python、SPSS、SASと、分析のツールを列挙すればキリがありませんが、
「データが小さくないと無理」、「お金がうなるほどないと無理」、「プログラミングに長けたエンジニアでないと無理」、
などなど、それぞれのツールには様々な制約が存在します。
むろんSQLにも制約があります。
そういう制約は少ないほうがいいに決まっていますが、さりとて現実的でない選択肢には意味がありません。
現実的にギリギリ可能な範囲で、でもできるだけ楽をしたい。
本書はそんな現実的で、しかしよくばりな要望に対して、SQLという解で答えたいと思います。
現実的にギリギリ可能な範囲で、でもできるだけ楽をしたい。
そんなよくばりな要望に対してのSQLという解での答え。
SQLを武器にデータ活用時代を生き抜く。
現実的な分析手法。
青木峰郎(あおき みねろう)
前職より大規模データウェアハウス構築の業務に関わり、並列RDBMSに目覚める。
現職のクックパッドではビッグデータ分析システム「たべみる」のアーキテクチャ設計から開発までを担当。
著書に『ふつうのLinuxプログラミング』『ふつうのHaskellプログラミング』(SBクリエイティブ)
『Rubyソースコード完全解説』(インプレス)などがある。
青木/峰郎
前職より大規模データウェアハウス構築の業務に関わり、現職のクックパッドではビッグデータ分析システム「たべみる」のアーキテクチャ設計から開発までを担当(本データはこの書籍が刊行された当時に掲載されていたものです)
まだレビューがありません
SQLデータ分析入門#4『LIMIT句を理解する』
SQLデータ分析入門#5『集計関数を理解する』
PostgreSQL+PostGISに格納したGTFS形式の公共交通オープンデータを操作する
SQLデータ分析入門#3『WHERE句を理解する』
初心者から data scientist・AI engineer になるための勉強法&おすすめサイト・本を一つの記事にまとめたかった
SQLデータ分析入門#6『結果の順番をいい感じにする』
BigQuery で Window Function を使って Cumulative Sum (累積和) を求める練習
SQLデータ分析入門#7『複数のテーブルにまたがって集計する』
【mySQLでデータ分析】Sequel Proでデータベースを作ってみる。
SQLデータ分析入門#1『SQLってなんだ』
SQLデータ分析入門#2『SELECT ~ FROM ~ を理解する』
アラフォーのWebディレクターがいきなりデータサイエンティストになる(その1:概要編)
アクセスログを用いて、サイトページのCVRを算出してみる【SQL初級編】
SQLデータ分析入門#8『基本的な関数を知る』