eygle.com   eygle.com
eygle.com  
 

« 美如昙花只一现 | Blog首页 | Oracle HowTo:查询Oracle各组件的版本信息 »

AWStats统计中的sitehao123等关键词清理

作者:eygle |【转载时请务必以超链接形式标明文章和作者信息及本声明
链接:

很早就发现在AWStats的后台统计中存在一些很奇怪的搜索引擎关键字,例如gb2312和sitehao123等;

而且还有一些数字形式的关键字,如503316480,201326592等;
这些关键字的搜索比例很高,在我的9月份不完全统计中,包含:

17655 个不同的关键字句 搜索 百分比
gb2312 5011 11.6 % 
sitehao123 728 1.6 % 
503316480 671 1.5 % 
201326592 658 1.5 % 


Che Dong对这个问题给出了解决方案,通过修改AWStats的search_engines.pm中的参数列表定义,可以过滤掉可能产生歧义的参数。

那么类似503316480,201326592的数字是什么呢?
通过Baidu搜索一下就可以找到答案,原来是图片搜索带来的参数,同样我们修改一下search_engines.pm的参数列表就可以过滤掉这些歧义参数。
我修改后再加入"ct="就可以过滤掉这些图片搜索带来的数字了:

@WordsToCleanSearchUrl= ('ct=','tn=','ie=','act=','annuaire=','btng=','cat=','categoria=','cfg=' ...

在抵达我的网站的关键字中,5460和中国同学录居然都排在了前列:

5460 91 1.2 %
中国同学录 89 1.1 %

看来同学的力量不可低估。

-The End-

By eygle on 2006-10-09 10:00 | Comments (1) | Posted to Web | Edit |Pageviews:

相关文章 随机文章
  • 2007 年终总结-Eygle.Com的发展历程
  • eygle.com完成建站以来最大的一次迁移
  • MT归档分页插件(Paged Archives)几个问题的解决
  • 任何伟大的网站都死过至少一次
  • Eygle.com访问用户男女比例构成
  • Oracle9i到10g,空闲等待事件的变化
    再招一名DBA
    Oracle OTN Lounge的活动安排
    骄阳似我-俺在八达岭滑雪的照片
    上海滩
    网上相关主题:
    Google

    留言 (1)

    哈哈,还有个sitehao123.com

    Posted by: sitehao123 at September 14, 2007 11:14 AM

    发表留言:



    Remember Me?
    (输入验证码后方可评论,谢谢支持)



    CopyRight © 2004 eygle.com, All rights reserved.