Google Summer of Code で日本語環境の改善

FSIJ が指導する夏のプロジェクトの募集テーマが公開になったみたい。登録は8日17:00(PST)、つまり日本時間では9日の午前2時が締め切りらしいので、興味ある人は登録しましょう。いくつか登録フォーム埋めないといけないようなので、実質8日中に始めないと登録完了しないのかも。

プロジェクトをいくつか抜粋すると、

WikiPedia の日本語テキストを処理し、言語の統計モデルのパラメータを推定するツールを作成

文字列をキーとして文字列を検索する機能を実装

かな漢字変換用の辞書に対し、Web経由でモデレートを行なうことのできるフロントエンドを作成

かな漢字変換エンジンの性能を評価する機能を実装

Tomoe(日本語手書き文字認識エンジン)とそのGUIを改良

日本語を母語としない人が日本語環境を利用するのに有用な機能を実現

周辺の文字列を見て変換結果の順序を変更する機能をOpenOffice.org上に実現

みたいなものがある。特に (1) なんかは yotaro-w くんあたりいかがでしょう……。と思って誘ったら、夏休みは研究の方向性を決める必要があるので今回はパスするらしい。いまやっていることと被っていて一石二鳥と思ったのだが……。

あと (3) のような web でなにかするツールは今年松本研のプロジェクト実習でも作るみたいだし、M1 の人でそっち方面に興味ある人なんか申し込んでみては。ちなみに松本研の夏のプロジェクト実習は募集人員を大幅に上回る応募があったらしい。