eygle.com   eygle.com
eygle.com eygle
eygle.com  
 

« 美如昙花只一现 | Blog首页 | Oracle HowTo:查询Oracle各组件的版本信息 »

AWStats统计中的sitehao123等关键词清理

很早就发现在AWStats的后台统计中存在一些很奇怪的搜索引擎关键字,例如gb2312和sitehao123等;

而且还有一些数字形式的关键字,如503316480,201326592等;
这些关键字的搜索比例很高,在我的9月份不完全统计中,包含:

17655 个不同的关键字句 搜索 百分比
gb2312 5011 11.6 % 
sitehao123 728 1.6 % 
503316480 671 1.5 % 
201326592 658 1.5 % 


Che Dong对这个问题给出了解决方案,通过修改AWStats的search_engines.pm中的参数列表定义,可以过滤掉可能产生歧义的参数。

那么类似503316480,201326592的数字是什么呢?
通过Baidu搜索一下就可以找到答案,原来是图片搜索带来的参数,同样我们修改一下search_engines.pm的参数列表就可以过滤掉这些歧义参数。
我修改后再加入"ct="就可以过滤掉这些图片搜索带来的数字了:

@WordsToCleanSearchUrl= ('ct=','tn=','ie=','act=','annuaire=','btng=','cat=','categoria=','cfg=' ...

在抵达我的网站的关键字中,5460和中国同学录居然都排在了前列:

5460 91 1.2 %
中国同学录 89 1.1 %

看来同学的力量不可低估。

-The End-


历史上的今天...
    >> 2009-10-09文章:
    >> 2008-10-09文章:
    >> 2007-10-09文章:
    >> 2005-10-09文章:
           太多的选择
           本站增加相册管理系统

无觅

By eygle on 2006-10-09 10:00 | Comments (1) | Web | 924 |

1 Comment

哈哈,还有个sitehao123.com


CopyRight © 2004~2020 云和恩墨,成就未来!, All rights reserved.
数据恢复·紧急救援·性能优化 云和恩墨 24x7 热线电话:400-600-8755 业务咨询:010-59007017-7040 or 7037 业务合作: marketing@enmotech.com