巨大データ処理の実践的指南書登場 Hadoopは今注目される「ビッグデータ」を扱うことのできる代表的な分散処理システムです。
フリーソフトウェアとして誰でも自由に使え、多数のPCを連動させて強力なパフォーマンスを発揮します。
本書は、このHadoopのデータ処理である「MapReduce」の基本を解説したものです。
Hadoopはデータをどう扱うのか、どんな処理が向いているのか、自分がやりたいことを実現するにはどう考えるのかなどを、基本となるいくつかのパターンを使って説明してきます。
新しいデータ処理に興味があり、具体的な方法を知りたいという方に最適の1冊です。
まだレビューがありません
windows上のeclipseでHadoopPigを使う(知人用メモ)