フレッシュな気持ちで機械翻訳の勉強

昨晩は19時ごろからだるくなり、早々と病院から帰宅してすぐ寝たのだが、朝起きても気分がすぐれず、もし風邪だと赤ちゃんにうつしてもよくないので、出勤前に病院に立ち寄るのはキャンセルさせてもらう。水曜日からずっと毎日朝晩は病院に通っているので、疲労が溜まってきたのだろうか……

午前中は機械翻訳の勉強会。今日で「機械翻訳」の第1章を読み終え、その場で演習問題をみんなで解いたりする。この勉強会、なぜか昨年度から研究室にいる学生は誰も出ておらず、逆に新入生は全員出ているのだが、ちょうどタイミングよくアナウンスが合った The 1st Workshop on Asian Translation に参加しようかと思い、機械翻訳グループへの希望者を募ったところ、新入生7人全員がとりあえず参加の名乗りを上げてくれた。最終的に全員が機械翻訳を研究テーマにすることはないだろうが、そのうちの何人かは機械翻訳を研究テーマにしてくれるだろうし、卒論や修論は別テーマにする人でもこれで一通りデータの前処理・後処理や NLP について学んでくれれば、それだけでも意義はあると思うので、嬉しいことである。自分も最近はだいぶ機械翻訳から遠ざかっていたので、2006年以降の機械翻訳の進展について勉強し直してみたい。

思えば、NAIST でも言語教育勉強会に人が増えたのは、HOO 2012CoNLL 2013 Shared Task: Grammatical Error Correction にチームで参加したからというのもあったし、最初はこういう共通タスクにプロジェクト的に参加するのもいいのかもしれない。共通タスクばかりやっていても発展性がないが、その研究グルーブに人が定常的にいれば、共通タスク以外のことをやる人も出てくるし、層が厚くなるのはよいことだ。

日本で現在もアクティブに機械翻訳の研究をしている(=新入生が定期的に研究グループに入ってきて、国際会議でも発表をしている)研究室は

  • NAIST 中村研
  • NAIST 松本研
  • 筑波大 山本研
  • 京大 黒橋研

くらいかと思う(うち、松本研で機械翻訳の研究をしている人は、いずれも車で15分くらいで行ける NTT コミュニケーション科学基礎研究所か、NICT という研究所の研究員の人と共同研究または実習指導してもらうことで、研究をする人が多い)。10年以内にこの中にうちの研究室を入れるという野望。本当は5年以内、と言いたいところだが、5年後にはいま研究室にいるメンバーは全員卒業しているだろうし、5年後ですらどうなっているんだろうか?(いまのメンバーの活躍を見て、現在の1-3年生が入ってきてくれると、継続的に研究できると思うので、がんばりどき)

午後は機械学習の基礎勉強会。今日は「言語処理のための機械学習」の第2章と第6章。2章分やったにも関わらず、1回の勉強会で(しかも時間をだいぶ余らせて)終わってびっくり。第1章は、勉強会を2回使わないと終わらなかったのだが……。まあ、初学者にハードなのは第3章と第4章だと思われるので、ちょうどいいペースかもしれない。

夕方はひたすらメール処理と翌日の準備。原稿も書かないといけないのだが、週末のメールの返事で書く時間が取れなかった。朝に体調が悪かったのが響いたなぁ。明日は時間が取れるといいけど……。

夜はコンビニで写真をプリントアウト(L判で1枚30円)し、病院に寄ってから帰る。

iPhone 5 で撮影した写真はどのように印刷するのが簡単かよく分からないのだが、結局「ネットワークプリント」というアプリを使用し、ファミリーマートで印刷(ローソンでも可能)。USB で接続するだけで印刷できるなら楽なのだが、ケーブルを持ち歩くのが面倒(昔のケーブルなら100均で売っているのだが、Lightning ケーブルは売っていない)。アカウントを作らないといけないのがいまいちであるが、そんなに使い勝手が悪いわけではない(ソフトウェアキーボードで長々とユーザ名を入れないといけないところがいけてないが)。これだけ簡単なら、もう使い捨てカメラの出番はなくなるわけだ。

体調がそんなによくないので、面会もカーテン越しにだいぶ離れたところからいそいそと、という感じだったが、やっぱりこの時期は毎日変わっているので、成長が楽しみだな〜。

帰宅してから翌日の講義の準備。去年のように毎週明け方までかかるわけではないが、意外と時間を取られる。毎週4時間程度だろうか? 6月以降は月曜日にも新規の授業が入るのだが、準備できるのかちょっと心配になってきた。