eygle.com   eygle.com
eygle.com  
 

« October 7, 2006 | Blog首页 | October 10, 2006 »



October 9, 2006

AWStats统计中的sitehao123等关键词清理

作者:eygle

出处:http://blog.eygle.com

很早就发现在AWStats的后台统计中存在一些很奇怪的搜索引擎关键字,例如gb2312和sitehao123等;

而且还有一些数字形式的关键字,如503316480,201326592等;
这些关键字的搜索比例很高,在我的9月份不完全统计中,包含:

17655 个不同的关键字句 搜索 百分比
gb2312 5011 11.6 % 
sitehao123 728 1.6 % 
503316480 671 1.5 % 
201326592 658 1.5 % 


Che Dong对这个问题给出了解决方案,通过修改AWStats的search_engines.pm中的参数列表定义,可以过滤掉可能产生歧义的参数。

那么类似503316480,201326592的数字是什么呢?
通过Baidu搜索一下就可以找到答案,原来是图片搜索带来的参数,同样我们修改一下search_engines.pm的参数列表就可以过滤掉这些歧义参数。
我修改后再加入"ct="就可以过滤掉这些图片搜索带来的数字了:

@WordsToCleanSearchUrl= ('ct=','tn=','ie=','act=','annuaire=','btng=','cat=','categoria=','cfg=' ...

在抵达我的网站的关键字中,5460和中国同学录居然都排在了前列:

5460 91 1.2 %
中国同学录 89 1.1 %

看来同学的力量不可低估。

-The End-

Posted by eygle at 10:00 AM | Comments (1)



CopyRight © 2004-2008 eygle.com, All rights reserved.