自然言語処理のためのツール

GentooChasenMeCab くらいしか入ってないのはけしからん、と思ってごそごそ作業。松本研の自然言語処理のためのツールにあるものが対象。

  • 日本語形態素解析システム Chasen は 2.3.3 と 2.4.0-preview1 (制約つき解析機能) が入っている。
  • 品詞タグ付きコーパス作成支援 GUI ツール VitualMorphs は宣伝条項つき BSD ライセンスなのでとりあえず見送り。
  • 高速形態素解析器システム MeCab は 0.80 まで入っていたが 0.81 がなかったので入れた。
  • SVM 学習ツール TinySVM はなかったので作成。
  • 汎用テキストチャンカー/タガー YamCha もなかったので作成。
  • 日本語係り受け解析システム CaboCha もなかったので作成。ビルドに時間がかかる。
  • LDA 学習ツール lda は Matlab が必要なようなので保留。
  • 高速文字列検索システム Sufary は少しライセンスについて考える必要ありかな。
  • コーパス管理・検索ツール ChaKi の GUIWindows 用のみ?

残りは今度にしよう。