Wikipedia と機械翻訳

今日の機械翻訳勉強会では jessic-r さんが来てくれるかなと思って

  • Sisay Fissaha Adafre and Maarten de Rijke. 2006. Finding Similar Sentences across Multiple Languages in Wikipedia. In EACL 2006 Workshop: Wikis and blogs and other dynamic text source, Trento, Italy.

を読んだ(手法の説明が分かりにくい割には単純なのに評価があまりしっかりしていないので、他の人が読むのはあまりお勧めしないけど)。Wikipedia には「他の言語」リンクがあるので、タイトル同士のリンク関係を使えばある程度対訳辞書が作れるのだが、そうやって作った対訳辞書なんかを使って、2言語間の文同士の対応がついたコーパス(パラレルコーパス)を作るという話。最後の結果のところまで来たら eric-n さんが「これ昔 jessic-r さんと読んだ」と言っていたが、読んでいたのか……

jessic-r さんが今度の IJCNLP で修士論文

  • Jessica Ramirez, Masayuki Asahara and Yuji Matsumoto. Japanese-Spanish Thesaurus Construction using English as a Pivot. IJCNLP-2008.

について話すらしいが、Wikipedia 使って対訳辞書作るという話はあまりないのかな?

Wikipedia いつもお世話になっているので、今日見たら寄付の募集がトップに出ていたから$100寄付しておいた(確か前回は5000円寄付したような)。アメリカにいたときのお給料ならこういう用途に使ってもいいや(カードの有効源が切れる NAIST 卒業までに残り日本円にして100万円くらい使い切らないといけないのだが、ドルでそんなに使うか少々疑問)と思ってクレジットカード情報入力したのだが、なんか弾かれたので Paypal で払う。なんだかなー。