焼肉とボリューム

ryu-i さんとゆうちゃんと焼肉に行く。アメリカンなサイズの肉ばかり食べているとボリュームに飽きてくる(ステーキって同じ箇所の肉をひたすら食べるので、自分としてはそんな分厚くなくていい)のだが、いろいろ食べられておいしかった。

shuya-a さんと大規模データの取り扱いについて話したのだが、MySQL だとインデックス作成がものすごく遅いらしいということを聞く。shuya-a さんも自分も同じようなことではまって同じような対処をしているそうだ。世の中はGBクラスのデータ突っ込んだだけで大規模なのかもしれないが、自然言語処理的にはTBクラスのデータを突っ込みたいわけで……(でもそこまで行くのは全然簡単ではない)。

bashi さんが「Wikipedia って大規模なのでは?」と言っていたが、Wikipedia (とかはてなとか)は数GBのオーダーなので、手ごろなサイズのデータとは言えても、日本語の大規模データというには少し小さい。質より量と言いたいとすると、やはりTBクラスがほしい(実際 Web をクロールするとその程度手に入る)のであった。