入門 ソーシャルデータ (オライリー・ジャパン)

 オライリー・ジャパンから最近刊行された「入門 ソーシャルデータ」の献本を頂きましたので、軽くレビューしてみます。監訳者に知っている名前がちらほら見えます。(そしてもちろんその中の一人から頂きました。)
 ソーシャルデータと一口で言ってしまうとどんなデータなのかちょっとわからないかもしれませんが、本書におけるソーシャルデータとは、TwitterとかレシピサイトとかFacebookとか、ソーシャルな要素の強いサービスで作られるデータの事を指します。ソーシャルデータを取ってきていくつかの手法で解析してみる、というのが本書の内容です。
 データを取ってくる、というところは結構重要で、データを解析する前にはまずある程度まとまった量のデータを入手する必要がありますが、データ収集を手作業でやるのは辛いのでプログラムを書いて自動化したい、だけどプログラムを書いて自動化するのもそれはそれで大変なわけです。仕事ならともかく趣味の場合、データ収集の段階で飽きてやめてしまった、という経験は皆さん持っているのではないでしょうか。本書はデータの収集についても詳しく書いてある(というか、ざっと読んでみた感じでは半分ぐらいはデータの収集にページを費やしている)ので、その部分が比較的簡単に乗り越えられるようになっています。
 良い点を挙げると、具体的なコードが載っており、初心者でもデータのクローリングから解析までなんとかこなせそうなところでしょうか。自分が初心者だった頃のことを思い出すとこういう本があってもキツい(サンプルコードを書き換えて動かすのもけっこう大変ですよね、最初は)だろうなとい思いますが、そこは経験を積んで頑張るしかないので、ここを取っ掛かりにして後は頑張って下さい、という感じでしょうか。なにもない状態でウェブ上の情報を調べつつ頑張るよりはだいぶハードルは低くできるのではないかと思います。
 集めてきたデータの解析については基礎的な手法を中心に紹介されており、例えば同じオライリーから出ている集合知プログラミングなどと比べても、全体的に初心者に優し目の構成になっているのかな、という気がします。自分がある程度経験を積んだプログラマであり、データ解析に自信があるならば、購入前に簡単に目を通して、自分とレベルがあっているのかを確認しておくのもよいでしょう。もしくは、例えばTwitterから簡単にデータを取ってきたい、みたいにバッチリ目的が合致するのであれば、中級者以上の方でも元が取れると思います。