eygle.com   eygle.com
eygle.com eygle
eygle.com  
 

« 据说这是一个幸运的年份... | Blog首页 | 寒冬中的温暖-SUN E4500温度过高当机 »

spam留言知几何之三

月初,修改了一下留言板的Spam处理机制,参考原作者的留言板程序,增加了认证码机制;此前我通过修改程序,采用了关键字过滤机制进行spam防范,也基本能够满足需要;现在通过 [认证码机制+关键字过滤],算是基本解决了spam留言问题。

现在是可以对spam进行总结的时候了。

最后一个月的spam留言大约如下:

mysql> select FROM_UNIXTIME(dateline,'%Y-%m-%d') 'date' ,count(*)
-> from spambook group by 1 order by 1 desc limit 30;
+------------+----------+
| date | count(*) |
+------------+----------+
| 2006-11-07 | 535 |
| 2006-11-06 | 884 |
| 2006-11-05 | 791 |
| 2006-11-04 | 811 |
| 2006-11-03 | 852 |
| 2006-11-02 | 869 |
| 2006-11-01 | 851 |
| 2006-10-31 | 873 |
| 2006-10-30 | 901 |
| 2006-10-29 | 90 |
| 2006-10-28 | 538 |
| 2006-10-27 | 828 |
| 2006-10-26 | 874 |
| 2006-10-25 | 820 |
| 2006-10-24 | 785 |
| 2006-10-23 | 851 |
| 2006-10-22 | 771 |
| 2006-10-21 | 745 |
| 2006-10-20 | 800 |
| 2006-10-19 | 793 |
| 2006-10-18 | 756 |
| 2006-10-17 | 820 |
| 2006-10-16 | 707 |
| 2006-10-15 | 680 |
| 2006-10-14 | 685 |
| 2006-10-13 | 728 |
| 2006-10-12 | 654 |
| 2006-10-11 | 579 |
| 2006-10-10 | 596 |
| 2006-10-09 | 420 |
+------------+----------+
30 rows in set (0.31 sec)

最高的时候一天竟然有900多条spam留言。
据不完全记录:

mysql> select count(*) from spambook;
+----------+
| count(*) |
+----------+
| 42487 |
+----------+
1 row in set (0.00 sec)

我已经记录了4万多的spam留言。
最常见的50个留言者是:

mysql> select distinct(username),count(*) ct
-> from spambook group by 1 order by 2 desc limit 50;
+--------------+-----+
| username | ct |
+--------------+-----+
| 斑竹网站做的 | 902 |
| 李先生 | 653 |
| 鱼鱼 | 615 |
| mm | 565 |
| 网站建设 | 482 |
| 上海美术培训 | 476 |
| 朋友 | 463 |
| 张先生 | 454 |
| 机电仪器仪表 | 441 |
| 王先生 | 403 |
| 先生 | 341 |
| 气模 | 338 |
| 付先生 | 317 |
| 韦先生 | 287 |
| 六合菜 | 286 |
| 王惠 | 274 |
| 陈小姐 | 243 |
| 心情 | 240 |
| 网络白领 | 240 |
| 92dv.com | 234 |
| 刘先生 | 231 |
| 网页设计 | 221 |
| 世界之光 | 215 |
| 王建国 | 192 |
| 机票联盟网 | 188 |
| 张小姐 | 183 |
| 吴先生 | 178 |
| 无码短片 | 173 |
| 俊羽 | 163 |
| 周先生 | 156 |
| 潘先生 | 156 |
| 陈先生 | 146 |
| 赵智锋 | 145 |
| tryrrVV | 135 |
| 黄飞 | 134 |
| 郑先生 | 133 |
| 阿德 | 130 |
| Sara11 | 124 |
| 陈生 | 124 |
| 孙大庆 | 120 |
| 传世私服 | 119 |
| asasas | 116 |
| 用友软件优惠 | 115 |
| 飞翔摄影化妆 | 114 |
| markkk | 113 |
| 大工业 | 112 |
| 客服部 | 111 |
| 郑生 | 111 |
| sdds | 110 |
| 臣向 | 105 |
+--------------+-----+
50 rows in set (0.38 sec)

同留言版的Spam斗争到此告一段落,这些spam留言的数据量已经高达70M,准备一举删除之:

[root@eygle eygle]# ll spam*
-rwxr-xr-x 1 mysql mysql 9126 Dec 13 2005 spambook.frm
-rwxr-xr-x 1 mysql mysql 73481172 Nov 7 14:44 spambook.MYD
-rwxr-xr-x 1 mysql mysql 350208 Nov 7 14:44 spambook.MYI

mysql的删除非常迅速:

mysql> delete from spambook;
Query OK, 42487 rows affected (0.15 sec)

而且删除之后,表文件会立即被清空:

[root@eygle eygle]# ll spam*
-rwxr-xr-x 1 mysql mysql 9126 Dec 13 2005 spambook.frm
-rwxr-xr-x 1 mysql mysql 0 Nov 24 17:11 spambook.MYD
-rwxr-xr-x 1 mysql mysql 1024 Nov 24 17:11 spambook.MYI

Mysql上如果没有日志,要想恢复删除的数据是很困难的;如果没有日志,Disk上还没有覆盖,那么对操作系统非常熟悉还有恢复的希望;这个处理起来比Oracle要困难一些。不过如果有良好的备份,那么一切就不再可怕。

我们常常会梦想,如果没有spam,世界将会有多么美好?

-The End-


历史上的今天...
    >> 2012-12-18文章:
    >> 2011-12-18文章:
    >> 2010-12-18文章:
    >> 2008-12-18文章:
    >> 2005-12-18文章:
           Blog写作一周年

无觅

By eygle on 2006-12-18 16:56 | Comments (4) | Web | 981 |

4 Comments

今天有一个我刚删除一条,他就发一条, 好象是手工发的. 最后我禁止立即发布留言, 终于他跑了, 然后我又改回原来的设置.

现在什么样的强人都有啊!

太强了,佩服, ^_^ :)

不过你的验证码还是稍显简单了点,其实把图片截成四段,每段跟一个预设置的数字图片比较,还是可以搞定的,我们之前用QTP搞定过这种简单的验证码.建议用那种扭曲的,呵呵.

一般的spamer都是简单的填表机,还没有太智能的:)


CopyRight © 2004~2020 云和恩墨,成就未来!, All rights reserved.
数据恢复·紧急救援·性能优化 云和恩墨 24x7 热线电话:400-600-8755 业务咨询:010-59007017-7040 or 7037 业务合作: marketing@enmotech.com