女児レコーズのアクセスログ解析

ろりこんぴ3を公開しました

せっかくなのでサイトのアクセスログを解析してみました。
まぁ解析というよりログファイルを読みやすくしているだけですが。

まずはアクセス元の解析
アクセスログファイルからグローバルIPアドレスを抜き出し、どの都市から接続されているかを調べました。
awk覚えたのでこれで頑張ります
$ awk -F'[ ,]’ ‘{count[$NF]+=1} END{for(i in count){print count[i],i}}’ jojirecords.imasu.jp.access.log | sort -gr >place.txt
うちのアクセスログは一番最後にグローバルIPアドレスがあるので、これをNFを利用して取得してます。
実行すると同じIPからのアクセス数とそのIPアドレスを書いたテキストファイルが出力されます。

とりあえずawk使えて満足なのでpythonに移行します!!!!!!!!!!!!!!!


#!/usr/bin/env python
# -*- coding: utf-8 -*-
import re, urllib
from BeautifulSoup import BeautifulSoup
r_ip = re.compile(r"\"?((\d{1,3}\.){3}\d{1,3})\"?")
r_content = re.compile(r".*whose location is (.*)\.")
placefile = open("place.txt", "r")
placeDictionary = {}
for line in placefile:
numAccess, dirtyIp = line.split(" ")
#if int(numAccess) < 100:
# continue
searchIp = r_ip.search(dirtyIp)
if searchIp:
cleanIp = searchIp.group(1)
openUrl = urllib.urlopen("http://www.iplocationfinder.com/"+cleanIp)
soup = BeautifulSoup(openUrl)
urlContent = soup.find("meta")["content"]
searchContent = r_content.search(urlContent)
if searchContent:
ipPlace = searchContent.group(1)
print numAccess,ipPlace
if ipPlace in placeDictionary:
placeDictionary[ipPlace] += int(numAccess)
else:
placeDictionary[ipPlace] = int(numAccess)
time.sleep(1)
savefile = open("ipPlace.txt","w+")
for key in placeDictionary:
writeline = str(placeDictionary[key])+" "+key+"\n"
savefile.write(writeline)

view raw

access.py

hosted with ❤ by GitHub

さっきのplace.txtを読み込んでipPlace.txtを吐き出します。
ipPlace.txtには http://www.iplocationfinder.com/ から取得したグローバルIPの地域情報と、同じ地域情報を持つところのアクセス数の合計が書いてあります。
これはソートされていないので見やすくソート。
$ sort -gr ipPlace.txt
するとこんな感じ(数字がアクセス数)

210910 Tokyo, Tokyo in Japan
79190 Japan
29088 Yokohama, Kanagawa in Japan
26035 Tamamura, Gumma in Japan
20795 Germany
11748 Osaka, Osaka in Japan
9044 Mountain View, California in United States
7447 Nagoya, Aichi in Japan
6821 Sapporo, Hokkaido in Japan
6789 Kawasaki, Kanagawa in Japan
….

まぁ日本が多いのはあたりまえだけどドイツが上位ってのが面白い。

次にクライアント
これも上と同じように指定のところをawkを使って抜き出した後にソートして出力している。
出力が汚くて同じクライアント名でも別々になってたりするのでちゃんと抜き出す方法考えないと。
とりあえずはまぁこんなでした(これも数字がアクセス数)

290619 (Windows
163566 (compatible;
137357 (Macintosh;
43640 (iPhone;
40148 (Linux;
17924 (Windows;
7126 (X11;
5901 (en-us)
5608 (iPad;
4187 (iPod;
….

モバイル端末いがいとあるな〜13位に1335 (Nintendo、19位に948 (PLAYSTATION(3DSとかWii?)もあってほへ〜って思った。

そんなことより天使のどろっぷだ!!!!!


女児レコーズ

こんにちはエアです。
ネットレーベルというかツイッターレーベル、女児レコーズ始めます。
ロリコンのロリコンによるロリコンのためのレーベルです。
あ、ペドでも構いません!
正直ノリで決めてしまったし、ちゃんと始められるのかもまだわかりません。

コンセプトは「女児を愛でる」です。
これ重要です。
もしくは「ロリでキュートでポップでキラキラな可愛い曲を作る」とかでしょうか。
でも、もちろんギラギラでドロドロでヌルヌルでしっとりな曲もあると思います。

現在メンバー募集中です。
もしかしたらM3に参加するかもしれません…?(とりあえず2011春は保留)
現在メンバー募集中なので、最高にロリコンな方はぜひ連絡を。
あとサイトつくってくれる方も募集しております。

[MEMBERS]
@airtoxin
@projecthl2
@taco_s
@9d0