Hadoopについて

Hadoopは結構本格的に開発されているみたいだな。Yahooも本腰入れて採用しようとしているらしい。

http://www.infoq.com/jp/articles/hadoop-interview

同僚のjavaハッカーにすすめてみよう。ちょうどログの分散処理解析を検討していた所だ。
javaだというと食いつきがいいかも。
動くものがあるとイメージしやすい。少しいじってみたがexampleの分散grepが普通に動いた。
自分でmapやreduceを書いてみようかな。

性能を出すためのパラメタチューニングのノウハウが身につくまでは色々問題有そうだけれど、はじめてみないと現実は動かせない。
うーんおもしろそうだ。

HBaseはHadoopについてくるBigtableライクなプロダクトだけれど、Javaで作られているらしい。
HyperTableはC++らしい。
とりあえずはHBaseでイメージ掴むか。どううれしいのか分からないし。

あと検索サービスの分析なんかには多分うってつけなのだろうから、彼らにも提言してみよう。
map reduceが何かもあまり分かっていなかったようだけれど、簡単に並列計算が実現できるといったら興味を持つだろうか。