2012年2月11日土曜日

RMeCab をインストールしてみた。

形態素解析ツール MeCab をR から使ってみようと思ったがインストールでハマったので備忘録。
R + MeCab + RMeCab を組み合わせるのだが上手くバージョンを合わせないと動かない。
間違うとこんな感じのエラーになる。
library(RMeCab)
RMeCabC("吾輩は猫である")

 *** caught segfault ***
address 0x0, cause 'unknown'
悲しくなるのでちゃんと動くように頑張ってみた。

動く事が検証出来た構成
OS: MacOSX(10.6)
R: 2.14.1
MeCab: 0.98 (*0.99ではダメだった)
RMeCab: 0.99

2012年2月4日土曜日

MongoDB で MapReduce 試してみた。

MongoDB で MapReduce を試してみる。
年齢のみを項目としてもつ age コレクションを作成し
  1. ヒストグラム
  2. 各種統計量(件数, 合計, 平均, 分散, 標準偏差)
を算出してみようと思う。
2. の統計量の算出では2段 MapReduce を試してみる。

参考:

MongoDB 環境構築(その3: ReplicaSet + Sharding)。

先日Tokyo.R第20回勉強会に参加してきた。
西新宿のNifty新社屋での開催で自宅から近かったのでちょっと見に行ったのだが思ったよりずっと面白くて今後も継続して参加する予定。外に出て人の話を聞くのは新鮮で気持ちが引き締まるし勉強のモチベーション向上に良いと思った。


今回は前回前々回の内容を合わせた ReplicaSet + Sharding 環境の構築を行う。
例のごとく複数台のサーバを用意する余裕(お金)は無いので1台のPCの複数ポートを用いる事で擬似的な分散サーバ環境を実現。


今回の目標: Sharding を行いつつ

  • mongod11 & mongod12 & arbiter13
  • mongod21 & mongod22 & arbiter23

という2組の ReplicaSet を構成。