2004年11月04日

このウェブサイトでの初めてのアクセス解析

[このエントリーのトラックバック先の記事]

昨日、このウェブサイトでの初めてのアクセス解析を、AWStats(このソフトは本当にオススメ!興味のある方はぜひこっちのページも見てください)を使ってやってみた。思ってたとおり、始めて間もないこのサイトのアクセスなんて大したことはなかったけど、この前えむもじらにトラックバックさせてもらった時は、けっこうな数の人が見に来てくれてたらしく、えむもじらを見てる人の多さにちょっとびっくり!記事の内容が内容だったってのはあるかもしれないけどね。

で、この機会に一度、アクセス解析の話でエントリーを書いてみようかなと思って、いろんなサイトを見てた時に、ふとこんな記事が目にとまった。簡単に言うと、Movable Typeを使ってるとエントリーの投稿時などに管理画面にアクセスする必要があるなど、普通のウェブサイトに比べて自分のアクセスがログ全体に占める割合が高くなるってことです。

なるほど、Movable Typeのようなツールを使ったことは初めてなので、そんなことを考えたことがなかったけど、確かにこれはありえますね。今までは、十分なアクセスがあるウェブサイトは、管理している人間からのアクセスも含めてカウントしても、大したノイズにはならないって思ってたけど(実際は十分なアクセスなんてないので、自分からのアクセスは当然排除してた)、Movable Typeなんかを使ってる場合は、自分からのアクセスを排除しないと、きちんとした解析はできそうもない。

うちではいつも、ログをAWStatsで解析する前に、一度フィルタをかけてきれいにしてたけど、試しにフィルタをかける前の状態のログを解析してみるとダントツの一位はmt.cgiだった(まだまだ全体のアクセス数が少ないからだけど)。

で、自分からのアクセスを排除するのがこんなに重要なことなんだったら、もう少しスマートな方法があるだろうと思って調べみたら、AWStatsのコンフィグファイルに次のような箇所がちゃーんとありました。

# Do not include access from clients that match following criteria.
# If your log file contains IP adresses in host field, you must enter here
# matching IP adresses criteria.
# If DNS lookup is already done in your log file, you must enter here hostname
# criteria, else enter ip address criteria.
# The opposite parameter of "SkipHosts" is "OnlyHosts".
# Note: Use space between each value. This parameter is not case sensitive.
# Note: You can use regular expression values writing value with REGEX[value].
# Change : Effective for new updates only
# Example: "127.0.0.1 REGEX[^192\.168\.] REGEX[^10\.]"
# Example: "localhost REGEX[^.*\.localdomain$]"
# Default: ""
#
SkipHosts=""

そうか、ここではねておけばよかったんですね。他にも

SkipUserAgents=""
SkipFiles=""

ってのもあります。

うちではもう今のままでいくけれど、必要な人は適切に設定してアクセス解析の精度を上げるべきだと思う。ひつこいけどAWStatsはイケテマス

2004年11月04日 01:24