2012年2月11日土曜日

RMeCab をインストールしてみた。

形態素解析ツール MeCab をR から使ってみようと思ったがインストールでハマったので備忘録。
R + MeCab + RMeCab を組み合わせるのだが上手くバージョンを合わせないと動かない。
間違うとこんな感じのエラーになる。
library(RMeCab)
RMeCabC("吾輩は猫である")

 *** caught segfault ***
address 0x0, cause 'unknown'
悲しくなるのでちゃんと動くように頑張ってみた。

動く事が検証出来た構成
OS: MacOSX(10.6)
R: 2.14.1
MeCab: 0.98 (*0.99ではダメだった)
RMeCab: 0.99



MeCab のインストール
$ tar xfz mecab-0.98.tar.gz
$ cd mecab-0.98
$ ./configure --with-charset=utf-8
$ make
$ sudo make install
辞書(IPADIC) のインストール
$ tar xfz mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf-8
$ make
$ sudo make install
RMeCab のインストール
$ R64

R version 2.14.1 (2011-12-22)
Copyright (C) 2011 The R Foundation for Statistical Computing
ISBN 3-900051-07-0
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)

> setwd("RMeCab_0.99.tgzを置いている場所")
> install.packages("RMeCab_0.99.tgz", destdir=".", repos = NULL)

適当に使ってみる。
> library(RMeCab)
> RMeCabC("我輩は猫である。名前はまだ無い。")
[[1]]
  名詞 
"我輩" 

[[2]]
助詞 
"は" 

[[3]]
名詞 
"猫" 

[[4]]
助動詞 
  "で" 

[[5]]
助動詞 
"ある" 

[[6]]
記号 
"。" 

[[7]]
  名詞 
"名前" 

[[8]]
助詞 
"は" 

[[9]]
  副詞 
"まだ" 

[[10]]
形容詞 
"無い" 

[[11]]
記号 
"。" 
ちゃんと動いた。

0 件のコメント:

コメントを投稿