基于na(i)ve bayes多变量贝努里事件模型的垃圾邮件过滤系统 |
| |
作者姓名: | 罗琴 |
| |
作者单位: | 西南石油大学,计算机科学学院,四川,成都,610500 |
| |
摘 要: | 在朴素贝叶斯算法的基础上,采用多变量贝努里事件模型对该算法进行改进,并基于改进的算法建立了一个垃圾邮件过滤系统.分别在Spam Assassin、CCERT 2005-Jul语料集上用cost-sensitive评价法对该系统进行评价,考虑到特征数量选取对结果的影响,先实验选取最佳性能时的特征数量.可以看到,该过滤系统可以达到很好的过滤效果.
|
关 键 词: | 朴素贝叶斯 垃圾邮件 特征提取 邮件过滤 |
本文献已被 万方数据 等数据库收录! |
|