マルコフ連鎖でツイートするbotを作った

もう普通に見かけるようになって何の面白みも無くなってきましたが作ってみました。
https://twitter.com/airtoxinbotbot
僕のツイートをマルコフ連鎖して新しいツイートをします。一応過去のツイートから最新のやつまで全部のツイート使って学習してるので(してるはず…)時間が経てばそれなりにマシなツイートをするようになるのかなぁと。
形態素解析はMeCabを使って、python-twitterでtwitterのapi越しに投稿してます。

マルコフ連鎖で文章を生成する場合は2重以上の連鎖数の方がいいらしいのですが、とりあえずということで1重マルコフ連鎖で作りました。暇があればオプションでN重にできるようにしたい…。
そのかわりと言ってはですがツイートの長さ上限を70〜100くらいにして意味の通る文章が生成されやすくしてます。
あとMeCabを通すとスペースが除去されたりurlが分解されてしまうのを何とかするのと、最近twitter webでも対応になった
_人人人人人人人人_
> 改行ツイート <
 ̄Y^Y^Y^Y^Y^Y^Y ̄
の処理をなんとかしたい。

コードとかはそのうちgithubの方にいろいろアレすると思います。

2013-07-13追記
とりあえずgithubあげました

  • Userstream対応
  • リプライ対応
  • 改行ツイート対応
  • ふぁぼ・パクリ対応
  • 広告


    コメントを残す

    以下に詳細を記入するか、アイコンをクリックしてログインしてください。

    WordPress.com ロゴ

    WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

    Twitter 画像

    Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

    Facebook の写真

    Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

    Google+ フォト

    Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

    %s と連携中