分かち書きをするのに有名なmecab。HyperEstraierでも使えるので1.3.2にするついでに使ってみることにした。
準備したファイル。

mecab-0.92.tar.gz
mecab-ipadic-2.7.0-20060707.tar.gz

(./configureでこけて、何かと思ったらautoconfとautomakeが無いと言うことだったらしい。自分の環境には入っていないという人は事前に入れるべし。)
mecabのインストール

$ tar zxfv mecab-0.92.tar.gz
$ cd mecab-0.92
$ ./configure --with-charset=utf8
$ make
$ make check
$ su
# make install

問題なく終了。
続いてmecab-ipadicを入れます。(タイムリーにニューバージョンがありました

$ tar zxfv mecab-ipadic-2.7.0-20060707.tar.gz
$ mecab-ipadic-2.7.0-20060707
$ ./configure --with-charset=utf8
$ make

としたらエラーが出た。

/usr/local/libexec/mecab/mecab-dict-index -d . -o . -f euc-jp -t utf8
dictionary.cpp(116) [iconv.open(from.c_str(), to.c_str())] iconv_open() failed with from=euc-jp to=utf8
make: *** [matrix.bin] エラー 255

うむむ。。。
こんな時は本家の説明をもっとよく読むこと。

$ cd mecab-ipadic-2.7.0-20060707
$ /usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t utf-8
# make install

今度は無事完了。
試してみると、

$ mecab
犬も歩けば棒に当たる
犬 名詞,一般,*,*,*,*,犬,イヌ,イヌ
も 助詞,係助詞,*,*,*,*,も,モ,モ
歩け 動詞,自立,*,*,五段・カ行イ音便,仮定形,歩く,アルケ,アルケ
ば 助詞,接続助詞,*,*,*,*,ば,バ,バ
棒 名詞,一般,*,*,*,*,棒,ボウ,ボー
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
当たる 動詞,自立,*,*,五段・ラ行,基本形,当たる,アタル,アタル
EOS

PuTTyでも化けずに表示されました。charsetもutf8で使えていると言うことだな。
さて、HEはどう変わるのやら…

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です