「集合知プログラミング」
2008.07.25
はい、買いました「集合知プログラミング」。
まだパラ見の状態ですが....要するにこれ、
プログラマのための統計学入門
というタイトルをつけてたら、売れないよね...という側面もあるかもね。ですから、「ネットの上から取れる統計的なデータ」から何か有用な情報を引き出すための、いろいろなテクニックを解説している、という感じの本です。
記述はとくに数式に足はつっこまず、アルゴリズムのレベルでやっつける、という感じの書き方です(最後に付録として数式でかいたものと、コードが対比されてます)。紹介されているテクニックは基本的なものがほとんど(というか、統計学知識の前提はゼロ)で、昔からよく知られているものが多いです...ピアスン相関係数の話から始まって、クラスター分析、因子分析、遺伝的アルゴリズム、ベイジアンフィルター...といった内容。
そういや大学の卒論でクラスター分析を使った憶えもある(FORTRANで書いたよ....)し、ベイジアン・スパムフィルターが話題になりかけた時、面白がって Perl のライブラリをゲットして、それを Java で書き直した...とか、結構私ここらへん好きだったりします。まあ、ものすごく斬新な内容ではないのですが、それでも
それをどう応用して、面白いサービスをするか?
という刺激を与えるという面では、それなりに良いポイントでの出版になるのかも。 「Web2.0 を空論にしないための基礎教養課程」くらいのつもりで読むのが良いのでは。
それでも良い点...というと、統計学って一般には全然知られてないに近い応用科学ですが、「95%有意」という言葉で象徴される、「すでにある仮説からそう結論できる・できない」を判別するための技法...というのではなくて、統計データから「新しい知見」を得るための技術としての統計学...というあたりでの内容ですから、新鮮に感じる方も結構多いのでは、とも思います。まあ啓蒙的な内容であると割り切れば、啓蒙としての役割はちゃんと果たせているのではないのでしょうか(ごめん、キッツイかな)。
とはいえ、以前「今後(内部でちょっとしたシミュレーションみたいなことをして、比較したいくつかの結果のうち最高のものをとりあえず「解」として返す)手法も一般にアリ、になるのでは」と書いたこともありますが、ようするにそういう手法の取っ掛かりにもなることでしょう。どうでしょうこれ?
投稿者 : 杉浦 こずえ | 投稿日時 : 2008.07.25 13:56
あすなろBLOGのトラックバック・コメントは承認制になっています。
すぐにブログに反映されませんので、ご了承ください。





