首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 0 毫秒
1.
罗琴 《黑龙江科技信息》2009,(28):101-101,156
在朴素贝叶斯算法的基础上,采用多变量贝努里事件模型对该算法进行改进,并基于改进的算法建立了一个垃圾邮件过滤系统。分别在Spam Assassin、CCERT2005-Jul语料集上用cost-sensitive评价法对该系统进行评价,考虑到特征数量选取对结果的影响,先实验选取最佳性能时的特征数量。可以看到,该过滤系统可以达到很好的过滤效果。  相似文献   

2.
龚薇 《科技广场》2005,(5):99-101
简单阐述了垃圾邮件的定义、现状和危害,对目前垃圾邮件的主要几种过滤技术进行了全面介绍和分析,并指出了垃圾邮件过滤技术的发展趋势。  相似文献   

3.
随着藏文编码字符集国际标准的制定,以及微软的第一个全面支持藏文的Windows Vista操作系统的发布,计算机对藏文的处理能力达到了与英文和汉文相同的级别.藏文垃圾邮件正处在萌发中,将对国家安全和社会稳定带来了威胁.贝叶斯算法广泛用于中、英文垃圾邮件过滤中,但藏文有其独特的语言特性,不能把国内外的研究成果直接应用到藏文垃圾邮件的过滤中.本文介绍了朴素贝叶斯算法的基本原理和藏文垃圾邮件的特殊性,最后分析了基于贝叶斯的藏文垃圾邮件过滤器的性能的几个因素.  相似文献   

4.
垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法。本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术,包括决策树、RoughSet、Bayes、kNN、SVM、Winnow等等。实验结果表明:FlexibleBayes、SVM、Winnow方法是目前较好的垃圾邮件过滤方法,它们在评测语料上的结果已经达到很高水平,但是,要走向真正实用化,还有很多的工作要做。  相似文献   

5.
介绍了垃圾邮件的现状,以及目前常见的反垃圾邮件的方法。针对贝叶斯算法的特点,介绍使用贝叶斯过滤的方法实现垃圾邮件的过滤技术。  相似文献   

6.
在邮件过滤的研究中,特征词的信息覆盖率决定了过滤结果的好坏。本文通过使用同义词词典对特征词进行扩充和收缩,并考虑特征词之间的组合,利用共现词之间的相关关系并通过改变特征词的权重设置,使邮件过滤更加准确,高效。实验结果表明了方法的有效性。  相似文献   

7.
目前对垃圾邮件的过滤主要有基于内容、基于IP地址和基于规则等方法,这些方法对垃圾邮件的过滤起到了一定作用。但单种邮件过滤技术只是针对邮件的某种属性进行过滤,因而造成邮件过滤判断的片面性。对此,设计了基于陪审团机制的邮件过滤系统。在这个系统中,各种现有的邮件过滤器对邮件的过滤结果,并非邮件过滤的最后结果,而是作为该系统的邮件过滤判断的一个输入值,最后根据系统所定的计算规则得出邮件的最终过滤结果。  相似文献   

8.
基于机器学习的垃圾邮件过滤技术   总被引:1,自引:0,他引:1  
垃圾邮件给人们的生活带来了极大的危害,为了制止垃圾邮件的进一步扩散,研究者们提出大量的检测算法.本文首先分析了垃圾邮件过滤的一般步骤,再对机器学习算法在垃圾邮件过滤技术中的应用进行了全面分析,最后对邮件过滤技术研究方向进行展望.  相似文献   

9.
从探究垃圾邮件现象出现的本质出发,剖析现有的反垃圾邮件技术,重点研究了多Agent技术在反垃圾邮件中的应用。通过对现有技术条件和应用环境的分析,多技术的融合、交叉与协作处理垃圾邮件是最有效的方法,应用也最广泛。然而,多种技术模块化的结合面对越来越高明的垃圾邮件发布者已经突显出它的弱点,多Agent技术为垃圾邮件过滤系统的设计提供了新的思路。在现有技术的基础上,研究了多Agent智能垃圾邮件过滤系统,主要研究内容为:利用多Agent系统的自学习和协同工作的特性,使得多种垃圾邮件过滤技术既能独立运行,也能协同工作,并通过反馈学习,不断更新对垃圾邮件特征的认识,从而提高垃圾邮件过滤系统的性能和准确率,构造出了基于多Agent智能垃圾邮件处理系统模型,提出了明确的反垃圾邮件技术应用建议。  相似文献   

10.
基于内容的垃圾邮件过滤技术综述   总被引:1,自引:0,他引:1  
针对垃圾邮件泛滥成灾的现状,综述了以邮件内容为主要过滤对象的垃圾邮件过滤的相关技术,通过各种技术的实验比较,总结了各自的过滤效果,从而为今后开发高水平的垃圾邮件过滤系统提供了一个基础平台。  相似文献   

11.
本文通过研究垃圾邮件的特征表示和过滤方法,设计了一种应用指纹特征向量表示方法和支持向量机(SVM)的最小序列最优化(SMO)方法的在线式邮件过滤器。在在线垃圾信息过滤上获得到了与传统方法相当的基础上,基于原始SMO算法提出了动态邮件样本工作集方法(DFSVM)对SMO的分类条件进行减弱,优化了在线过滤模式下的运算时间。  相似文献   

12.
互联网的发展逐渐改变了人们的生活方式,电子邮件因其方便、快捷的特点已受到人们的青睐。但许多垃圾邮件同时也在网络中蔓延,占据了邮件服务器的大量存储空间,用户往往需要花费大量的时间去删除这些垃圾邮件。因此,研究邮件的自动过滤具有重要意义。邮件的自动过滤主要有基于规则和基于统计两种方式。而目前基于统计的过滤器中,常用的贝叶斯方法等是建立在经验风险最小化的基础之上,过滤器推广性能较差。支持向量机(SVM)是在统计学习理论的基础上发展而来的一种新的模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。它不仅考虑了对推广能力的要求,而且追求在有限信息的条件下得到最优结果。因此,本文将支持向量机应用于邮件过滤,实验证明过滤效果较好。  相似文献   

13.
垃圾邮件的泛滥提出了极为迫切的技术诉求,文章介绍了基于文本分类技术的垃圾邮件过滤系统模型,首先介绍了整个系统工作流程,然后阐述了系统中文本分词,文本特征提取,Winnow线性分类器等关键环节。  相似文献   

14.
甘金明  万励  吴洁明 《科技通报》2012,28(10):116-118
为了提高手机垃圾短信检测率,提出一种分层协作的垃圾短信过滤模型,将黑白名单作为垃圾短信过滤第一道防线,贝叶斯算法作为第二道防线,并及时更新系统特征库.仿真结果表明,本文算法能够高效地识别垃圾短信,有效地降低了误报率,具有重要的研究价值和社会意义.  相似文献   

15.
[目的/意义]旨在为寻找简单有效的图书推荐分类算法提供参考.[方法/过程]构建了包括数据预处理、分类器和图书推荐引擎的基于模型的图书推荐系统.指出应在数据预处理时对书籍的属性值进行选择和格式化,需对比不接受文本数据和接受文本数据的两组分类器,并选择合适的特征,如作者、年份、出版商、用户ID、位置和年龄,进行评分预测.以...  相似文献   

16.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号