使用 Apache, 它的 log 档 default 是叫 access.log, 是一个连续且不断长大的档案, 只要 log 不是关闭状态, 凡是用户连向你的网站, 就会有像这样的一笔记在 log:
192.168.0.2 - - [01/Jul/2005:17:22:04 +0800] "GET /wp/archives/2005/06/27/12/28/41/ HTTP/1.1" 200 9760 "http://www.saab.club.tw/guestbook/guestconte...Board_Level=3" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"
依序是用户 IP, 时间, 动作, 回覆码, 回传资料大小(bytes), referer(从什么地方连过来), 用户端浏览器资料;后端 log 分析程式可以依此计算出计多有趣的统计.
但是一个连续且不断长大的 log 档是不方便使用、管理和备份的, 最好是可以依照某种方法把档案作分割. cronolog 就是因应这样的需求而生的, 它可以在 win32 或 unix 平台运作, 这里可以下载.
使用的方法也很简单, 只要修改你的 Apache 设定档 httpd.conf, 把 default 的
CustomLog logs/access.log combined
改成
CustomLog "|c:/bin/cronolog.exe logs/access_%Y%m%d.log" combined
就好了. 其中 c:/bin/cronolog.exe (这个是 win32 用的) 就是你放 cronolog 的目录, 后面的 logs/access_%Y%m%d.log 是 log 产出的目录 (logs) 及形式, access_%Y%m%d.log 会生出像 access_20050702.log 这样的档名, 每天一个档案. 别忽略了一开始的 “|” 那是 pipeline 给 cronolog 作处理的意思.
你也许会问: 啊留 Apache 的 log 要作什么? 用途多者呢, 一来出问题的时候可以查问题, 像上次的盗连事件; 二来可以交给后端的 log 分析程式, 如免费的 awstats, 统计看看有多少人看你的网页、每天流量、每小时流量比较、他们从哪里来、用什么样的字词从搜寻引擎搜寻到你的网页等等等… 有很多好玩的! 例如这个可以看2005年六月份用户来自国家的统计, 好多奇奇怪怪的国家 、2005年六月份用户端浏览器的使用率; 嗯,Firefox还是要多加油,一直只在8%~10%左右;.
cronolog 详细参数意义: