« 美如昙花只一现 | Blog首页 | Oracle HowTo:查询Oracle各组件的版本信息 »
AWStats统计中的sitehao123等关键词清理
作者:eygle | 【转载请注出处】|【云和恩墨 领先的zData数据库一体机 | zCloud PaaS云管平台 | SQM SQL审核平台 | ZDBM 数据库备份一体机】
链接:https://www.eygle.com/archives/2006/10/awstat_wordstoclean.html
链接:https://www.eygle.com/archives/2006/10/awstat_wordstoclean.html
很早就发现在AWStats的后台统计中存在一些很奇怪的搜索引擎关键字,例如gb2312和sitehao123等;
而且还有一些数字形式的关键字,如503316480,201326592等;
这些关键字的搜索比例很高,在我的9月份不完全统计中,包含:
17655 个不同的关键字句 搜索 百分比 gb2312 5011 11.6 % sitehao123 728 1.6 % 503316480 671 1.5 % 201326592 658 1.5 %
Che Dong对这个问题给出了解决方案,通过修改AWStats的search_engines.pm中的参数列表定义,可以过滤掉可能产生歧义的参数。
那么类似503316480,201326592的数字是什么呢?
通过Baidu搜索一下就可以找到答案,原来是图片搜索带来的参数,同样我们修改一下search_engines.pm的参数列表就可以过滤掉这些歧义参数。
我修改后再加入"ct="就可以过滤掉这些图片搜索带来的数字了:
@WordsToCleanSearchUrl= ('ct=','tn=','ie=','act=','annuaire=','btng=','cat=','categoria=','cfg=' ...
在抵达我的网站的关键字中,5460和中国同学录居然都排在了前列:
5460 91 1.2 %
中国同学录 89 1.1 %
看来同学的力量不可低估。
-The End-
历史上的今天...
>> 2019-10-09文章:
>> 2009-10-09文章:
>> 2008-10-09文章:
>> 2007-10-09文章:
>> 2005-10-09文章:
By eygle on 2006-10-09 10:00 | Comments (1) | Web | 924 |
哈哈,还有个sitehao123.com