python-mecabのセットアップ

ふと自然言語処理をしたくなったので形態素解析ができるMeCabをインストールした
のでその手順をメモ
MeCabのインストールからpythonで使えるようになるまでを書いてます

〜ダウンロード〜
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html#download
ここから本体と辞書をダウンロード
本体はsourceからtar.gzファイルを

〜インストール〜
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html#install
ここに書いてあるスクリプトの通り実行
辞書の./configureのときに

./configure --with-charset=utf8

としないと表示がうまくされなかった

〜python-mecabのセットアップ〜

ここの通りに
aptitudeコマンドがないのでpip search python-devで似たようなモジュールがないか探してみると、
どうやらPython-DevEnvってのがそれっぽいのでインストール
pip install Python-DevEnv
をして、あとは「mecab-python のインストール」ってところをやればいい

hoge.py

#!/usr/bin/env python  
# -*- coding: utf-8 -*- 

import MeCab

tag = MeCab.Tagger("-Owakati")
text = "すもももももももものうち"
res = tag.parse(text)
print res

上のコードを保存して実行すると
すもも も もも も もも の うち
ちゃんとできてるっぽい