amd64 の計算機を再インストールしたので、以前入っていたソフトを入れ直すという作業をしているのだが、以前のシステムは Fedora Core 3 という Linux ディストリビューションで、今回のシステムは Gentoo に変えたので、物によってはパッケージがない(つま…
年末ということで研究室には人も少ない。しばらく不在だった ai-a さんが昨日あたりから復帰したので、いつもの研究室の夜長の風景でなんとなく落ち着く。そういえば最近 shuya-a さんが夜型。 最近講義がなくなってから夜型になってしまったせいか、起きて…
結局問題5問中今日もできたのは2問だけだが、もうこのまま年明けは3章に。春休みまでには3章終わるかな。5章まであるのだけど。 終わったら忘年会。少し酔っぱらったので英語の話で盛り上がる。年明けからは shuya-a さんも英語でしゃべらナイト見るメンバー…
今日が今年最後の勉強会の日。 まず FSNLP (Foundations of Statistical Natural Language Processing)の輪読。今日は mitsu-ko くんと yotaro-w くんの担当だった。yotaro-w くんはしっかりスライド作ってきていてかなり分かりやすかった。年内に担当部分終…
松本研のメイン計算環境に使われている5台のうち、今日はもう1台する予定だったが、M2 の人は入れ替えが後ろになれば後ろになるほど大変なので、もう早いうちにががっと入れ替えてください、と ryu-i さんに言われて、nozomi-k さんや kazuo-h さんも対象の…
言い換え勉強会と意味談話勉強会は1月5日から始まるらしい(しかも進捗報告)。午前中に勉強会して午後帰省することになるのだが、10日から授業も始まっているしあまりゆっくりできない……
停電の影響で松本研の計算機が軒並み落ちてしまったので復旧作業。 再起動したら立ち上がってくれるはずのサーバが起きてくれないので懸命に起こす。二度寝しないでくれー CD から立ち上がってくれないサーバがあったので古き良き時代のフロッピーなるものを…
Dell の PowerEdge 1600SC というサーバにもう1つ Gentoo を入れることになっていて、もうバイナリパッケージも全部コンパイルしてあるし、catalyst を使ってインストール用の tarball も作ってある(tar を展開すればいいだけ。こういうのが簡単にできるのが…
前回の勉強会での説明は少し速かったとの指摘があったので、今回は前回の復習から入ってそこそこ時間かけて進める。おかげで今日中に第8章(自分は前半のみ担当)は終わらなくなってしまったが、他の M1 の人の反応は上々だったので、けっこう嬉しかった。次回…
松本研では週に1回ドクターレクチャーと題して主に博士課程の人が自然言語処理からトピックを一つ選んで解説してくれるというものがあるのだが、最近このレクチャーの出席率がやけに悪い。そもそもこのレクチャー、M1 のためにあるはずなのに M1 は4人しか出…
勉強会が7時から始まって(途中9時半で勉強会は交替したが)終わったのは11時過ぎ。たいへんだー
FSNLP 勉強会でスライドを作って担当分の説明をしたのだが自分の手応えとしては微妙。ryu-i さんからは「それでは英語の勉強にならないから少なくとも用語くらいはちゃんと英語を押さえてほしい」と注文がつく。 スライドを見ていた人からは「分かりやすくて…
CJE 勉強会は発表者2人の都合が悪くなったので中止。研究会もなんか人がまばら(先週に続き今週も発表予定の人が一人来なかった)。みんな風邪なんだろうか?
水曜日の自然言語処理の基礎勉強会の準備。これまで全然準備していなかったので、思ったより時間がかかる(資料作成込みで12時間くらいかかっているが、まだアニメーションを調整したりするのが残っている)。前回自分が担当したのは夏休み前だから、何ヶ月ぶ…
機械翻訳勉強会のあと shuya-a さんが「自然言語処理にいちばんいいプログラミング言語ってなんだろうね」と eric-n さんと自分に話を振ってきたので、eric-n さんが Python で自然言語処理をするためのツール Natural Language Toolkit http://nltk.sourcef…
今日の機械翻訳勉強会では Philipp Koehn, Franz Josef Och, and Daniel March ``Statistical Phrase-Based Translation’’, HLT-NAACL(2003) を読んだ。 前日3時間くらいかけて自宅の Mac の PowerPoint でスライド作っていたのだが、いざ研究室に来て Think…
意味談話解析勉強会はメンバーの今後の研究方針についての議論、言い換え勉強会は研究の進捗報告ということで、勉強会が終わったのは夜10時半。そもそも始まる時間も遅かったが……
合同研2日目。campbe-h さんとホテルは同じ部屋だったのだが、2人して朝寝過ごしそうになった。campbe-h さんによると、自分は声をかけたらがばっと起きたそうで、そういうところは campbe-h さんと似ているらしい。他には声かけても気づかず、叩いたり揺ら…
今日明日は JAIST (北陸先端科学技術大学院大学)で JAIST・東工大・NAIST などの大学の自然言語処理学講座が合同して開く研究会で朝から車に乗って JAIST に。 朝7時半に車で出発して午後11時には着いていたので昼ご飯食べたりとか。しかし徹夜明けなので眠…
今日の言い換え勉強会は進捗報告だというので出ないで寝ていたら他の人たちは全員出ていたらしい。最近(というかここ2週間くらい)選択間違えることが多い。困った困った。 しかも来週意味談話解析勉強会でも全員進捗報告になったし。機械翻訳勉強会の論文紹…
今日の言い換え勉強会は天気がよかったので外で。 最初は芝生の上かなと思ったのだが、机と椅子があったほうがいい、ということでゲストハウスせんたん(NAIST にはこういう恥ずかしい名前の宿泊施設兼トレーニングルームみたいなところがあるのです)前の机に…
今週の金曜日に中間発表で、その日に発表することになっている mitsu-ko くんと一緒に松本研で発表練習。資料は15ページくらいに抑えたのだが、事前に2回くらい自分で時間を計ってみたところ、どうも15分くらいかかってしまう。結局練習でも14分半。いろいろ…
今日の離散数学は母関数。母関数という言葉自体初めて聞いたのだが、generating function が母関数という訳になるのか? 部分分数分解の仕方にも定跡あるんだなあ。ちなみに「じょうせき」というのは囲碁では「定石」と書くが将棋では「定跡」と書く。「定石…
2週間あって SICP やる時間ありまくってウハウハになる予定だったのだが、現実はそんなに甘くなく、やはり前日くらいになってから慌ててやることになってしまう。 今回の範囲は8クイーン問題と画像を扱う言語(Picture Language)の部分なのだが、どうしても画…
eric-n さんがいま統計的機械翻訳のデモを作っていて、とりあえずエンコーダで日本語と英語の単語同士を対応づけるために、日本語側を文単位で毎回 ChaSen にかけて分かち書きをしていた(日本語は ChaSen のような形態素解析器というものを使わないと単語と…
そうこうする間に自分は研究会発表。bashi さんも今日はゼミナールII発表で、彼もゼミナール発表なんかより研究室での発表のほうがよほど緊張する(そういえば松本研の他の M1 の人もそう言っていた)と言っていたが、自分もこっちのほうが気がかり。その割に…
明日研究会発表なので発表資料作成。実験で解析に失敗した例を自分で見て、解析プログラムの気持ちになってなんでそういう解析になったのかトレースし、どこに問題点があるのか探すのだが、毎回毎回資料を作る段になってから、説明したいポイントが全部入っ…
夏休み前は M1 向けの勉強会(Foundations of Statistical Natural Language Processing という本を読む勉強会と離散数学の本を読んで問題を解く勉強会)は2時間3時間やるのは当たり前だったのに、夏休み明けると1時間やそこらで終わることが多くてそっちに慣…
shuya-a さんが「外部からもらうデータ(コーパスとかなんだとか)は基本的に正しいデータだった試しがないので自分で前処理してから使っている」と言っていた。そんなもんか。 機械翻訳勉強会では hideto-k さんが「国も1億円くらい出して対訳コーパス作れば…
今日は意味・談話解析勉強会で Adam Meyers, Ruth Reeves and Catherine Macleod, NP-External Arguments: A Study of Argument Sharing in English, ACL(2004) Workshop on MWE という論文を紹介。名詞の述語項構造にどういうものがあるか、NomBankというプ…