« 美如昙花只一现 | Blog首页 | Oracle HowTo:查询Oracle各组件的版本信息 »
AWStats统计中的sitehao123等关键词清理
作者:eygle |【转载时请务必以超链接形式标明文章原始出处和作者信息及本声明】链接:http://www.eygle.com/archives/2006/10/awstat_wordstoclean.html
很早就发现在AWStats的后台统计中存在一些很奇怪的搜索引擎关键字,例如gb2312和sitehao123等;
而且还有一些数字形式的关键字,如503316480,201326592等;
这些关键字的搜索比例很高,在我的9月份不完全统计中,包含:
17655 个不同的关键字句 搜索 百分比 gb2312 5011 11.6 % sitehao123 728 1.6 % 503316480 671 1.5 % 201326592 658 1.5 %
Che Dong对这个问题给出了解决方案,通过修改AWStats的search_engines.pm中的参数列表定义,可以过滤掉可能产生歧义的参数。
那么类似503316480,201326592的数字是什么呢?
通过Baidu搜索一下就可以找到答案,原来是图片搜索带来的参数,同样我们修改一下search_engines.pm的参数列表就可以过滤掉这些歧义参数。
我修改后再加入"ct="就可以过滤掉这些图片搜索带来的数字了:
@WordsToCleanSearchUrl= ('ct=','tn=','ie=','act=','annuaire=','btng=','cat=','categoria=','cfg=' ...
在抵达我的网站的关键字中,5460和中国同学录居然都排在了前列:
5460 91 1.2 %
中国同学录 89 1.1 %
看来同学的力量不可低估。
-The End-
By eygle on 2006-10-09 10:00 | Comments (1) | Posted to Web | Edit |Pageviews:
| 相关文章 | 随机文章 |
|
|
Oracle9i到10g,空闲等待事件的变化 再招一名DBA Oracle OTN Lounge的活动安排 骄阳似我-俺在八达岭滑雪的照片 上海滩 |
网上相关主题:
留言 (1)
哈哈,还有个sitehao123.com
Posted by: sitehao123 at September 14, 2007 11:14 AM
