从1000封垃圾邮件中提取出部分垃圾邮件关键词

[ 2005-11-12 14:52:30 | 作者: admin ]
字号: | |
经过一周的垃圾邮件收集,本人从1000封垃圾邮件中提取出部分垃圾邮件关键词,希望大家能不吝赐教~

关键词分类及列表如下:

一.诱惑性短语

免费类:
1.免费
2.优惠
3.特惠
4.特价
5.便宜
6.廉价

秘密类:
1.秘密
2.机密
3.保密
4.绝密
5.神密
6.秘决

情色类:
1.sex
2.movie
3.电影
4.色情
5.情色
6.激情
7.男人
8.女人
9.伟哥
10.性福
11.裸体
12.美女

金钱类:
1.赚钱
2.发财
3.致富
4.创业
5.代开
6.代理
7.热销
8.法宝
9.宝典
10.成功
11.直投
12.做主

二.反X类短语

略......


  本人的垃圾邮件过滤机制如下:

1.通过一周时间观察,收集通用垃圾邮件关键词
2.用一天时间将通用关键词用于主机进行全局制定,对客户之企业邮局进行个性化自主定制
3.通过一周观察后,逐步制定黑名单列表,白名单列表,及非统计内关键词,在本观察周内使用如下过滤机制:a.特色过滤 b.短语过滤 c.脚本过滤 d.附件过滤 e.贝叶斯统计 f.连接过滤。
4.首先对被认定的垃圾邮件进行如下处理:转发至垃圾处理专用邮箱spam@domain。其次对垃圾邮件进行检测,分析误判率,并调整相应贝叶斯机制,及增减相应关键词。
5.对两周来分析及检测进行总结,制定出完善之防垃圾邮件机制,并在后续一个月时间继续跟踪...垃圾邮件是个永恒的话题,应该随新特征的出现,及时修改防范机制。

  以上5步,为本人的分析心得。希望大家能多提出通用关键词,一起完善这个艰巨的分析任务。
评论Feed 评论Feed: http://blog.xg98.com/feed.asp?q=comment&id=173

浏览模式: 显示全部 | 评论: 1 | 引用: 0 | 排序 | 浏览: 3199
引用 65982097
[ 2009-03-11 09:12:10 ]
兄弟挺佩服你的 我也在研究这个 不过是刚刚起步,希望能多交流交流,可以加QQ97668738

此日志不可发表评论。