共查询到16条相似文献,搜索用时 0 毫秒
1.
在朴素贝叶斯算法的基础上,采用多变量贝努里事件模型对该算法进行改进,并基于改进的算法建立了一个垃圾邮件过滤系统。分别在Spam Assassin、CCERT2005-Jul语料集上用cost-sensitive评价法对该系统进行评价,考虑到特征数量选取对结果的影响,先实验选取最佳性能时的特征数量。可以看到,该过滤系统可以达到很好的过滤效果。 相似文献
2.
简单阐述了垃圾邮件的定义、现状和危害,对目前垃圾邮件的主要几种过滤技术进行了全面介绍和分析,并指出了垃圾邮件过滤技术的发展趋势。 相似文献
3.
随着藏文编码字符集国际标准的制定,以及微软的第一个全面支持藏文的Windows Vista操作系统的发布,计算机对藏文的处理能力达到了与英文和汉文相同的级别.藏文垃圾邮件正处在萌发中,将对国家安全和社会稳定带来了威胁.贝叶斯算法广泛用于中、英文垃圾邮件过滤中,但藏文有其独特的语言特性,不能把国内外的研究成果直接应用到藏文垃圾邮件的过滤中.本文介绍了朴素贝叶斯算法的基本原理和藏文垃圾邮件的特殊性,最后分析了基于贝叶斯的藏文垃圾邮件过滤器的性能的几个因素. 相似文献
4.
垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法。本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术,包括决策树、RoughSet、Bayes、kNN、SVM、Winnow等等。实验结果表明:FlexibleBayes、SVM、Winnow方法是目前较好的垃圾邮件过滤方法,它们在评测语料上的结果已经达到很高水平,但是,要走向真正实用化,还有很多的工作要做。 相似文献
5.
介绍了垃圾邮件的现状,以及目前常见的反垃圾邮件的方法。针对贝叶斯算法的特点,介绍使用贝叶斯过滤的方法实现垃圾邮件的过滤技术。 相似文献
6.
7.
8.
基于机器学习的垃圾邮件过滤技术 总被引:1,自引:0,他引:1
垃圾邮件给人们的生活带来了极大的危害,为了制止垃圾邮件的进一步扩散,研究者们提出大量的检测算法.本文首先分析了垃圾邮件过滤的一般步骤,再对机器学习算法在垃圾邮件过滤技术中的应用进行了全面分析,最后对邮件过滤技术研究方向进行展望. 相似文献
9.
从探究垃圾邮件现象出现的本质出发,剖析现有的反垃圾邮件技术,重点研究了多Agent技术在反垃圾邮件中的应用。通过对现有技术条件和应用环境的分析,多技术的融合、交叉与协作处理垃圾邮件是最有效的方法,应用也最广泛。然而,多种技术模块化的结合面对越来越高明的垃圾邮件发布者已经突显出它的弱点,多Agent技术为垃圾邮件过滤系统的设计提供了新的思路。在现有技术的基础上,研究了多Agent智能垃圾邮件过滤系统,主要研究内容为:利用多Agent系统的自学习和协同工作的特性,使得多种垃圾邮件过滤技术既能独立运行,也能协同工作,并通过反馈学习,不断更新对垃圾邮件特征的认识,从而提高垃圾邮件过滤系统的性能和准确率,构造出了基于多Agent智能垃圾邮件处理系统模型,提出了明确的反垃圾邮件技术应用建议。 相似文献
10.
基于内容的垃圾邮件过滤技术综述 总被引:1,自引:0,他引:1
针对垃圾邮件泛滥成灾的现状,综述了以邮件内容为主要过滤对象的垃圾邮件过滤的相关技术,通过各种技术的实验比较,总结了各自的过滤效果,从而为今后开发高水平的垃圾邮件过滤系统提供了一个基础平台。 相似文献
11.
本文通过研究垃圾邮件的特征表示和过滤方法,设计了一种应用指纹特征向量表示方法和支持向量机(SVM)的最小序列最优化(SMO)方法的在线式邮件过滤器。在在线垃圾信息过滤上获得到了与传统方法相当的基础上,基于原始SMO算法提出了动态邮件样本工作集方法(DFSVM)对SMO的分类条件进行减弱,优化了在线过滤模式下的运算时间。 相似文献
12.
互联网的发展逐渐改变了人们的生活方式,电子邮件因其方便、快捷的特点已受到人们的青睐。但许多垃圾邮件同时也在网络中蔓延,占据了邮件服务器的大量存储空间,用户往往需要花费大量的时间去删除这些垃圾邮件。因此,研究邮件的自动过滤具有重要意义。邮件的自动过滤主要有基于规则和基于统计两种方式。而目前基于统计的过滤器中,常用的贝叶斯方法等是建立在经验风险最小化的基础之上,过滤器推广性能较差。支持向量机(SVM)是在统计学习理论的基础上发展而来的一种新的模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。它不仅考虑了对推广能力的要求,而且追求在有限信息的条件下得到最优结果。因此,本文将支持向量机应用于邮件过滤,实验证明过滤效果较好。 相似文献
13.
垃圾邮件的泛滥提出了极为迫切的技术诉求,文章介绍了基于文本分类技术的垃圾邮件过滤系统模型,首先介绍了整个系统工作流程,然后阐述了系统中文本分词,文本特征提取,Winnow线性分类器等关键环节。 相似文献
14.
15.
[目的/意义]旨在为寻找简单有效的图书推荐分类算法提供参考.[方法/过程]构建了包括数据预处理、分类器和图书推荐引擎的基于模型的图书推荐系统.指出应在数据预处理时对书籍的属性值进行选择和格式化,需对比不接受文本数据和接受文本数据的两组分类器,并选择合适的特征,如作者、年份、出版商、用户ID、位置和年龄,进行评分预测.以... 相似文献
16.