女児レコーズのアクセスログ解析

ろりこんぴ3を公開しました

せっかくなのでサイトのアクセスログを解析してみました。
まぁ解析というよりログファイルを読みやすくしているだけですが。

まずはアクセス元の解析
アクセスログファイルからグローバルIPアドレスを抜き出し、どの都市から接続されているかを調べました。
awk覚えたのでこれで頑張ります
$ awk -F'[ ,]’ ‘{count[$NF]+=1} END{for(i in count){print count[i],i}}’ jojirecords.imasu.jp.access.log | sort -gr >place.txt
うちのアクセスログは一番最後にグローバルIPアドレスがあるので、これをNFを利用して取得してます。
実行すると同じIPからのアクセス数とそのIPアドレスを書いたテキストファイルが出力されます。

とりあえずawk使えて満足なのでpythonに移行します!!!!!!!!!!!!!!!

さっきのplace.txtを読み込んでipPlace.txtを吐き出します。
ipPlace.txtには http://www.iplocationfinder.com/ から取得したグローバルIPの地域情報と、同じ地域情報を持つところのアクセス数の合計が書いてあります。
これはソートされていないので見やすくソート。
$ sort -gr ipPlace.txt
するとこんな感じ(数字がアクセス数)

210910 Tokyo, Tokyo in Japan
79190 Japan
29088 Yokohama, Kanagawa in Japan
26035 Tamamura, Gumma in Japan
20795 Germany
11748 Osaka, Osaka in Japan
9044 Mountain View, California in United States
7447 Nagoya, Aichi in Japan
6821 Sapporo, Hokkaido in Japan
6789 Kawasaki, Kanagawa in Japan
….

まぁ日本が多いのはあたりまえだけどドイツが上位ってのが面白い。

次にクライアント
これも上と同じように指定のところをawkを使って抜き出した後にソートして出力している。
出力が汚くて同じクライアント名でも別々になってたりするのでちゃんと抜き出す方法考えないと。
とりあえずはまぁこんなでした(これも数字がアクセス数)

290619 (Windows
163566 (compatible;
137357 (Macintosh;
43640 (iPhone;
40148 (Linux;
17924 (Windows;
7126 (X11;
5901 (en-us)
5608 (iPad;
4187 (iPod;
….

モバイル端末いがいとあるな〜13位に1335 (Nintendo、19位に948 (PLAYSTATION(3DSとかWii?)もあってほへ〜って思った。

そんなことより天使のどろっぷだ!!!!!

広告


コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中