ウェブや電子メールに代表されるように、テキストデータが大量に流通、蓄積されるようになった。
文字列で記述されたデータの山から情報や知識を探し出すテキストマイニングの手法がさまざまな分野で必要になってきている。
テキスト化された顧客の声から新たなニーズを抽出したり、迷惑メールを自動判別するなど、実用的な場面ですでに多くの活用がなされている。
また、学術的な場面でも計量言語学やゲノム解析といった分野を中心に、強力な研究手段となっている。
このように幅広い分野で共通に用いられる統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いた実践で身につけるのが本書の目的である。
統計的テキストデータ解析に焦点を絞り、初歩的な統計学の解説からはじめて、近年提案されたデータマイニング手法まで紹介している。
そのおもな内容は文系・理系を問わず理解できるだろう。
金/明哲
1988年中国から来日。
1994年9月総合研究大学院大学統計科学専攻博士後期課程修了。
博士(学術)。
札幌学院大学社会情報学部教授を経て、2005年より同志社大学文化情報学部教授(本データはこの書籍が刊行された当時に掲載されていたものです)
まだレビューがありません
RubyとRでRandomForest