Treasure Data
Treasure Data はいわゆるログ解析基盤のためのクラウドサービスです。 (現在 beta ですが、利用させていただいています)。 TD は、
- ログをいくらでも貯めこんでくれる
- HiveQL を client 経由で投げるとクラウドの向こう側で Hadoop が起動し結果を返してくれる
- クエリをスケジューラに入れておくと、定期的にその解析結果を MySQL などに突っ込んでくれる。こちらから閲覧するときはそれを SELECT するだけ
と、かゆいところに手が届くサービスです。
http://engineering.crocos.jp/post/21478792903/crocos
このようなサービスだったのか.
データ解析を行なうクラウドサービスの課題は多い.私がぱっと思いつくものだけでも,プライバシー保護の必要性や,データ転送によるレイテンシなどがある.
こうした課題が解決され,コンサルティングを含めた緻密なサービスが提供されるようになれば,企業におけるデータの解析・マイニングの光景も,今とは異なったものとなるのかもしれない.
まあ,私はその「今」を知らないわけですが.