首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
互联网的发展逐渐改变了人们的生活方式,电子邮件因其方便、快捷的特点已受到人们的青睐。但许多垃圾邮件同时也在网络中蔓延,占据了邮件服务器的大量存储空间,用户往往需要花费大量的时间去删除这些垃圾邮件。因此,研究邮件的自动过滤具有重要意义。邮件的自动过滤主要有基于规则和基于统计两种方式。而目前基于统计的过滤器中,常用的贝叶斯方法等是建立在经验风险最小化的基础之上,过滤器推广性能较差。支持向量机(SVM)是在统计学习理论的基础上发展而来的一种新的模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。它不仅考虑了对推广能力的要求,而且追求在有限信息的条件下得到最优结果。因此,本文将支持向量机应用于邮件过滤,实验证明过滤效果较好。  相似文献   

2.
在邮件过滤的研究中,特征词的信息覆盖率决定了过滤结果的好坏。本文通过使用同义词词典对特征词进行扩充和收缩,并考虑特征词之间的组合,利用共现词之间的相关关系并通过改变特征词的权重设置,使邮件过滤更加准确,高效。实验结果表明了方法的有效性。  相似文献   

3.
基于机器学习的垃圾邮件过滤技术   总被引:1,自引:0,他引:1  
垃圾邮件给人们的生活带来了极大的危害,为了制止垃圾邮件的进一步扩散,研究者们提出大量的检测算法.本文首先分析了垃圾邮件过滤的一般步骤,再对机器学习算法在垃圾邮件过滤技术中的应用进行了全面分析,最后对邮件过滤技术研究方向进行展望.  相似文献   

4.
基于内容的垃圾邮件过滤技术综述   总被引:1,自引:0,他引:1  
针对垃圾邮件泛滥成灾的现状,综述了以邮件内容为主要过滤对象的垃圾邮件过滤的相关技术,通过各种技术的实验比较,总结了各自的过滤效果,从而为今后开发高水平的垃圾邮件过滤系统提供了一个基础平台。  相似文献   

5.
随着藏文编码字符集国际标准的制定,以及微软的第一个全面支持藏文的Windows Vista操作系统的发布,计算机对藏文的处理能力达到了与英文和汉文相同的级别.藏文垃圾邮件正处在萌发中,将对国家安全和社会稳定带来了威胁.贝叶斯算法广泛用于中、英文垃圾邮件过滤中,但藏文有其独特的语言特性,不能把国内外的研究成果直接应用到藏文垃圾邮件的过滤中.本文介绍了朴素贝叶斯算法的基本原理和藏文垃圾邮件的特殊性,最后分析了基于贝叶斯的藏文垃圾邮件过滤器的性能的几个因素.  相似文献   

6.
垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法。本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术,包括决策树、RoughSet、Bayes、kNN、SVM、Winnow等等。实验结果表明:FlexibleBayes、SVM、Winnow方法是目前较好的垃圾邮件过滤方法,它们在评测语料上的结果已经达到很高水平,但是,要走向真正实用化,还有很多的工作要做。  相似文献   

7.
从探究垃圾邮件现象出现的本质出发,剖析现有的反垃圾邮件技术,重点研究了多Agent技术在反垃圾邮件中的应用。通过对现有技术条件和应用环境的分析,多技术的融合、交叉与协作处理垃圾邮件是最有效的方法,应用也最广泛。然而,多种技术模块化的结合面对越来越高明的垃圾邮件发布者已经突显出它的弱点,多Agent技术为垃圾邮件过滤系统的设计提供了新的思路。在现有技术的基础上,研究了多Agent智能垃圾邮件过滤系统,主要研究内容为:利用多Agent系统的自学习和协同工作的特性,使得多种垃圾邮件过滤技术既能独立运行,也能协同工作,并通过反馈学习,不断更新对垃圾邮件特征的认识,从而提高垃圾邮件过滤系统的性能和准确率,构造出了基于多Agent智能垃圾邮件处理系统模型,提出了明确的反垃圾邮件技术应用建议。  相似文献   

8.
阎巍  南洋 《科技通报》2012,28(10):158-159,162
研究了支持向量机与自组织神经网络的原理,利用支持向量机的小样本学习与推广能力强的特点,结合自组织神经网络良好的学习能力与收敛速度,实现了对支持向量机算法的改进.利用Lincoln实验室入侵检测系统评估数据集合对改进算法进行测试,并将实验结果与BP神经网络进行了比较,结果表明,改进的算法在检测精度与训练时间方面均优于BP神经网络.  相似文献   

9.
高晓琴 《科技通报》2012,28(4):70-71
主要研究了文本分类精度问题。介绍了文本分类的基本过程,提出了一种改进的支持向量机文本分类技术,设计并实现了一个开放的中文文档自动分类系统。实验结果表明,提出的方法不仅具有较高的训练效率,同时也能得到很高的分类准确率和查全率。  相似文献   

10.
罗琴 《黑龙江科技信息》2009,(28):101-101,156
在朴素贝叶斯算法的基础上,采用多变量贝努里事件模型对该算法进行改进,并基于改进的算法建立了一个垃圾邮件过滤系统。分别在Spam Assassin、CCERT2005-Jul语料集上用cost-sensitive评价法对该系统进行评价,考虑到特征数量选取对结果的影响,先实验选取最佳性能时的特征数量。可以看到,该过滤系统可以达到很好的过滤效果。  相似文献   

11.
垃圾邮件的泛滥提出了极为迫切的技术诉求,文章介绍了基于文本分类技术的垃圾邮件过滤系统模型,首先介绍了整个系统工作流程,然后阐述了系统中文本分词,文本特征提取,Winnow线性分类器等关键环节。  相似文献   

12.
为了解决传统径向基网络结构确定难和故障样本不足的问题,本文结合支持向量机(Support Vector Machine,SVM)在解决小样本数据集及非线性问题上的独特优势,提出了一种基于支持向量机的径向基网络故障诊断方法:并将该方法应用在滚动轴承的故障诊断上,实验结果表明该方法不仅可以提高径向基网络的训练速度,而且还可以获得更准确的诊断结果。  相似文献   

13.
龚薇 《科技广场》2005,(5):99-101
简单阐述了垃圾邮件的定义、现状和危害,对目前垃圾邮件的主要几种过滤技术进行了全面介绍和分析,并指出了垃圾邮件过滤技术的发展趋势。  相似文献   

14.
在朴素贝叶斯算法的基础上,采用多变量贝努里事件模型对该算法进行改进,并基于改进的算法建立了一个垃圾邮件过滤系统.分别在Spam Assassin、CCERT 2005-Jul语料集上用cost-sensitive评价法对该系统进行评价,考虑到特征数量选取对结果的影响,先实验选取最佳性能时的特征数量.可以看到,该过滤系统可以达到很好的过滤效果.  相似文献   

15.
提出了一种结合颜色和形状特征的图像检索方法,针对传统基于内容图像检索不能很好满足用户需求的问题,提出了一种基于支持向量机(SVM)的相关反馈算法来捕捉用户的检索意图。实验结果证明,算法能发挥用户在检索过程中的作用,具有较好检索性能。  相似文献   

16.
系统建模与寻找函数的全局最优解是很常见的工业应用问题。本文首先讨论使用支持向量机来根据由系统中提取的样本数据进行函数拟合,然后将所得到的函数作为目标函数,介绍了用遗传算法寻找函数最优解的步骤,并对优化结果进行了检验,结果表明了遗传算法具有良好的全局快速搜索能力。  相似文献   

17.
支持向量机(support vector machine)是一种建立在结构风险最小化原则基础上的全新机器学习方法,具有很强的学习能力和泛化性能,能够较好地解决小样本、高维数、非线性、局部极小等实际问题。虽然支持向量机较其它学习方法在很多方面都具有难以比拟的优越性,但是作为一种新型的技术,支持向量机目前仍然具有一些局限性,尤其是它在支持增量式学习方面还不够好,所以对向量机进行增量学习有着一定的必要性。一方面,由于使用者在训练初期对问题理解的局限性以及问题的高度复杂性,一般很难精确地定义所要的完整的训练集;另一方面,要在初期就收集一个非常完整的训练集是非常困难甚至是难以实现的。本文基于以上的思想对支持向量机增量学习进行研究,通过对原有算法的研究找到一个新的支持向量机增量学习算法。  相似文献   

18.
决策支持系统是跨学科的综合体系,涉及机器学习理论。支持向量机是近几年发展起来的学习方法,它是利用最优分类面(线)将两类样本在特征空间或输入空间中无错误地分开,而且要使两类的分类空隙最大。然而当两类中的样本数量差剐悬殊时,支持向量机的分类能力会下降。为了解决此问题,本文提出了一种改选的支持向量机算法,在所开发的医学决策支持系统上的应用表明,此方法在解决两类样本数量十分不均衡问题时有着很强的分类能力,不失为一种有效的决策分析工具。  相似文献   

19.
基于改进的SVM文本分类建模   总被引:1,自引:0,他引:1  
SVM是一种新的分类工具,可是其核函数在数学上必须满足Mercer条件,使得具有良好全局分类性能的Sigmoid函数在SVM中应用受到限制。本文将Sigmoid核函数与云模型相结合,提出一种简单的核函数的实现方法。此方法不仅提高了SVM文本分类能力,而且明显地减少了平均的CPU执行时间。  相似文献   

20.
阐述了针对中小型企业供需信息自动化Web信息抽取技术的研究。自动化是指不需要人工标注网页抽取规则学习样本,系统能够从不同的求购信息网站的网页里自动获取相应的信息抽取规则,通过引入领域特征来净化抽取到文本字段而获得较高的查准率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号