これはなに?

インストール

コマンドラインから使ってみる

[~]$ cd /opt/sen/bin
[/opt/sen/bin]$ export SEN_HOME=/opt/sen
[/opt/sen/bin]$ sh sen.sh 
Picked up _JAVA_OPTIONS: -Dfile.encoding=UTF-8
done.
Please input Japanese sentence:
[INFO] Dictionary - token file = /opt/sen/dic/token.sen
[INFO] Dictionary - time to load posInfo file = 13[ms]
[INFO] Dictionary - double array trie dictionary = /opt/sen/dic/da.sen
[INFO] DoubleArrayTrie - loading double array trie dict = /opt/sen/dic/da.sen
[INFO] DoubleArrayTrie - loaded time = 0.4[ms]
[INFO] Dictionary - pos info file = /opt/sen/dic/posInfo.sen
[INFO] Dictionary - time to load pos info file = 1[ms]
[INFO] Tokenizer - connection file = /opt/sen/dic/matrix.sen
[INFO] Tokenizer - time to load connect cost file = 61[ms] 
すもももももももものうち
すもも  (すもも)        名詞-一般(0,3,3)        スモモ  スモモ
も      (も)    助詞-係助詞(3,4,1)      モ      モ
もも    (もも)  名詞-一般(4,6,2)        モモ    モモ
も      (も)    助詞-係助詞(6,7,1)      モ      モ
もも    (もも)  名詞-一般(7,9,2)        モモ    モモ
の      (の)    助詞-連体化(9,10,1)     ノ      ノ
うち    (うち)  名詞-非自立-副詞可能(10,12,2)   ウチ    ウチ

形態素解析のサンプルに「すもももももももものうち」を使うのは、言語処理の分野でのお約束らしい

Maven2 のローカルレポジトリ(~/.m2)に登録

Javaから使ってみる


Java#Others


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS   sitemap
Last-modified: 2011-05-22 (日) 02:48:08 (2027d)
ISBN10
ISBN13
9784061426061