python-mecabのセットアップ

ふと自然言語処理をしたくなったので形態素解析ができるMeCabをインストールした
のでその手順をメモ
MeCabのインストールからpythonで使えるようになるまでを書いてます

〜ダウンロード〜
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html#download
ここから本体と辞書をダウンロード
本体はsourceからtar.gzファイルを

〜インストール〜
http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html#install
ここに書いてあるスクリプトの通り実行
辞書の./configureのときに

./configure --with-charset=utf8

としないと表示がうまくされなかった

〜python-mecabのセットアップ〜
http://tatsuyaoiw.hatenablog.com/entry/20120414/1334405065
ここの通りに
aptitudeコマンドがないのでpip search python-devで似たようなモジュールがないか探してみると、
どうやらPython-DevEnvってのがそれっぽいのでインストール
pip install Python-DevEnv
をして、あとは「mecab-python のインストール」ってところをやればいい

hoge.py

#!/usr/bin/env python  
# -*- coding: utf-8 -*- 

import MeCab

tag = MeCab.Tagger("-Owakati")
text = "すもももももももものうち"
res = tag.parse(text)
print res

上のコードを保存して実行すると
すもも も もも も もも の うち
ちゃんとできてるっぽい

広告


コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中