Gentoo に Chasen と MeCab くらいしか入ってないのはけしからん、と思ってごそごそ作業。松本研の自然言語処理のためのツールにあるものが対象。
- 日本語形態素解析システム Chasen は 2.3.3 と 2.4.0-preview1 (制約つき解析機能) が入っている。
- 品詞タグ付きコーパス作成支援 GUI ツール VitualMorphs は宣伝条項つき BSD ライセンスなのでとりあえず見送り。
- 高速形態素解析器システム MeCab は 0.80 まで入っていたが 0.81 がなかったので入れた。
- SVM 学習ツール TinySVM はなかったので作成。
- 汎用テキストチャンカー/タガー YamCha もなかったので作成。
- 日本語係り受け解析システム CaboCha もなかったので作成。ビルドに時間がかかる。
- LDA 学習ツール lda は Matlab が必要なようなので保留。
- 高速文字列検索システム Sufary は少しライセンスについて考える必要ありかな。
- コーパス管理・検索ツール ChaKi の GUI は Windows 用のみ?
残りは今度にしよう。