言語処理も UI の工夫次第で使い物になる

この1週間は Word と PowerPoint と格闘しているのだが、これがまたしんどい。どうやら Office for Mac 2011 と Windows の Office の互換性が高くないようで、図表を入れたところの文字が見えたり見えなかったりするのである。Office for Mac 2008 で開くと見えるので、失われたわけではないようなのだが、Office for Mac 2008 が入っているマシンは普段の作業用のものではないし、どうもフォントは Office for Mac 2011 のほうが再現度が高いので、困りものである。

というわけで VMware FusionMac の中に入っていたのを思い出して設定。Drobo (外付け HDD) 上にあったのを直接起動できるかと思いきや、やはり (というか当然) Firewire 経由で起動するのは厳しく、結局数十GBローカルにコピーする。前 使っていた SSD (160GB) だと容量が厳しかったので、Drobo にコピーしたのだが、Mac mini に切り替えたとき容量的な問題で HDD に戻したからであった (元あった SSD@syou6162 さんに差し上げた)。

VMware の中の Windows 7 を立ち上げてみると、どうやら MS Office 2010 Beta しか入っていないようなので、いったん削除して MS Office 2010 をインストール。今年の1月からいままで一度も Windows を触っていなかったようである (1月に立ち上げたのも、言語処理学会年次大会の原稿のために新しい MS-IME の動作確認をするためであったような気がする)。英語版だが無事崩れず件のファイルを開くことができた。全画面表示すると完全に Windows で仕事しているように見える……。

最近 Evernote を本格的に使い始めたのだが、これは相当便利である。無料会員で使っていたときはどこでも書けるメモ帳代わりに使っていただけなのだが、ScanSnap と組み合わせて使い始めて便利さを再認識。

Mac に標準でついてくる「スティッキーズ」という付箋アプリケーションは、MobileMe という Apple の有料サービスに加入していると複数の Mac 間で同期できて便利なのだが、MobileMe のサービス自体有料の割には微妙だし、だからこそ iCloud という別のサービスでのリプレースがアナウンスされたのだろう。EvernoteScanSnap と組み合わせて使うとすぐ月60MBを超えるので、有料会員にならざるを得ないが、それでも MobileMe の年間料金より安いし、Find My iPhone サービスくらいしか MobileMeEvernote の差分でお金を払ってもいいと思うようなものがない。

ScanSnap の何が便利かというと、スキャンした活字の日本語と英語を (一応どちらの言語で読み込むかスキャン時に指定しないといけないが) 自動で認識して検索可能にしておいてくれるところ (この機能自体は Adobe Acrobat の機能なのだが、AcrobatScanSnap に同梱されている)。PDF の文字認識機能も、認識した単語だけを表示させると認識誤りが目につくのだろうが、認識した単語は検索可能な文字として画像とは違うレイヤーに埋め込んでおくことで、誤りが目につきにくくなっているのが秀逸である。(逆に言うと認識誤りがあって、本来マッチしてほしい単語にマッチしていない場合でもスルーしている可能性があるので、論文検索なんかだったら念のためウェブ検索と併用した方が安全だが)

自分で読んで書き込んだ論文に加え、ミーティングの資料とか、大学の仕事のマニュアル (その場でしか配られない) とか、放っておくと散逸しがち、かつまとめてあっても物理的にそこに行かないと読めなかったものが、あっさり検索可能になる、というのはとても大きい (検索でヒットしなくても、そもそも検索すらできなかったものが検索可能になっただけでも革命的である)。惜しむらくは、Evernote の PDF ビューワーの不具合で、検索して見つかった単語がうまくハイライトできない (左右の位置は合っているが、上下の位置がずれている。Acrobat で見るとちゃんとした位置に埋め込まれているのが分かるので、Evernote 側の不具合だろう) ことだが、これもそのうち解決されるだろう。

PDF 自体を検索可能にするのは Acrobat の機能だが、Evernote の嬉しいところはサーバにアップロードしたファイルのインデックス (索引) をサーバ側で保持し、サーバ側で検索可能にしてくれるところ。これだといくら大量にファイルをアップロードしても一瞬で検索可能なので、とても嬉しい。(全部ローカルに持つ形式だと全文を探さないといけないので遅い) 文字認識精度もサーバ側が更新されたらもっと改善されると思うし。

難点を挙げるとすると、iPhoneiPad のアプリだとスキャンした PDF や JPEG の中身をリーダーで表示しながらブラウズできないことかな (1ページ目のプレビューは表示されるので、だいたい感じは分かるのだけど)。タッチして開けばもちろん普通に見られが、Mac のように常にリーダーを立ち上げるようにはできないのかなぁ。UI の問題かもしれないし、常時表示させるのは iPhone (iPod) 等のスペックの問題で処理が追いつかないので厳しいのかもしれないが、iPad くらいならできるんじゃないかと思うし、Evernote に保存したデータは全部オフラインでも使えるように iPhone/iPad にダウンロードして使っている (いま見たら700ファイルほどで1GB程度使っている) ので、少なくともタッチしなくても表示できるようにするオプションがほしい。

最近論文の添削は Dropbox にファイルを入れており、研究室で作業した続きをそのまま家でもしたり、その逆をしたりしている。以前はファイルを複数箇所で編集するときは、自分のメールアドレスに添付して送ったり、ftp (古い) や scp でコピーしたりしていたのだが、それと比べるとだいぶ楽になった。いまの環境だと大本のデータはサーバ側にあり (複数箇所に置いてある)、それぞれの最新のコピーが Mac (x2)、iPadiPhone それぞれにあるので、いつ手許の端末が壊れても復旧までにそれほど時間がかからなくなったし、失われるものはほとんどない。便利な時代になったものである。