2012-05-05
2012-04-26
Megaman / GitHub
格好良い.
2012-04-23
Treasure Data
Treasure Data はいわゆるログ解析基盤のためのクラウドサービスです。 (現在 beta ですが、利用させていただいています)。 TD は、
- ログをいくらでも貯めこんでくれる
- HiveQL を client 経由で投げるとクラウドの向こう側で Hadoop が起動し結果を返してくれる
- クエリをスケジューラに入れておくと、定期的にその解析結果を MySQL などに突っ込んでくれる。こちらから閲覧するときはそれを SELECT するだけ
と、かゆいところに手が届くサービスです。
http://engineering.crocos.jp/post/21478792903/crocos
このようなサービスだったのか.
データ解析を行なうクラウドサービスの課題は多い.私がぱっと思いつくものだけでも,プライバシー保護の必要性や,データ転送によるレイテンシなどがある.
こうした課題が解決され,コンサルティングを含めた緻密なサービスが提供されるようになれば,企業におけるデータの解析・マイニングの光景も,今とは異なったものとなるのかもしれない.
まあ,私はその「今」を知らないわけですが.
2012-04-19
CPU vs. GPU
2012-04-19
Factory Method
2012-04-01
そのアルゴリズム,もう名前がついてるよ?
そういや以前KnuthがきたときGoogleぽい質問ということで、すでにあるっぽいアルゴリズムを思いついたときそれの名前をどうやって検索する?と訊いたひとがいた。自分も年で長年のいい友人がいるから彼らに聞くだろうね、というのが答えだった。そりゃそうだな。
— Rui Ueyamaさん (@rui314) 4月 1, 2012
2012-03-30
tcmalloc in Chromium
TL が glibc malloc と jemalloc で盛り上がる中、この二カ月 tcmalloc と格闘していたアカウントがこちらになります
— Dai MIKURUBEさん (@dmikurube) 3月 30, 2012@dmikurube tcmallocはOSに一切メモリを返さない仕様なので再起動前提だと思っていたのですが、実際そうなんでしょうか?
— Kazuki Ohtaさん (@kzk_mover) 3月 30, 2012@kzk_mover 生 tcmalloc は確かにあまり返さないです。アリーナ単位でどかっと返すことはあったと思うので再起動前提というほどではないはずですが。 Chromium で使っている tcmalloc には改造されていて、それなりによく返すようになっていたりします
— Dai MIKURUBEさん (@dmikurube) 3月 30, 2012