Apache/ログ解析ツール のバックアップ(No.2) |
|
「解析」っていう程のツールがフリーであればうれしいんですが、ほとんどのツールは「統計」止まりだと思います。
集計処理には時間がかかります。まずは、ログ出力の設定を見直して、出力量を必要最小限に抑えた方がいいでしょう。
(1) awstats.plファイルの先頭付近に、以下の記述を追加。
use Encode qw/encode decode/;
(2)「sub DecodeEncodedString」という関数を探して、その内容を全て以下のように置換します。
sub DecodeEncodedString { my $stringtodecode=shift; $stringtodecode =~ tr/\+/ /s; $stringtodecode =~ s/%([A-F0-9][A-F0-9])/pack("C", hex($1))/ieg; my $decodedstrings = decode( "euc-jp" , $stringtodecode ); utf8::encode($decodedstrings); return $decodedstrings; }
これでOK。
不明ブラウザが結構多いので、それらも分類したいなと思いまして…。
browsers.pmの@BrowsersSearchIDOrder に追加
'sleipnir', # RSS Reader 'hatena', 'bloglines', 'rssbar', 'livedoorcheckers', 'rantenna', 'glucose',
browsers.pmの%BrowsersHashIDLib に以下を追加
'sleipnir','Sleipnir', # RSS Reader 'hatena','Hatena Antenna', 'bloglines','Bloglines', 'rssbar','RssBar', 'livedoorcheckers','livedoorCheckers', 'rantenna','rAntenna', 'glucose','glucose',
とりあえず以上で様子を見ます。
LogFile="cat_accesslog.bat |"
Cannot convert search phrase from US-ASCII character set. Either the web browser was wrong or this system's default locale doesn't reflect this browser default. You might wish to tweak the current locale.ログ解析を中断しちゃう
3 [main] webdruid 2948 handle_exceptions: Exception: STATUS_ACCESS_VIOLATION 437 [main] webdruid 2948 open_stackdumpfile: Dumping stack trace to webdruid.exe.stackdumpのは、ちょっと困りものですね。