首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
本文分析数据主要来自从CCERT垃圾邮件蜜罐网获取的中文垃圾邮件,用户举报信息以及CCERT应急响应系统接收和处理的垃圾邮件事件信息.CCERT反垃圾邮件小组利用“CCERT垃圾邮件蜜罐网“将发送到ccert.edu.cn域,而又不存在实际对应用户的方式获取垃圾邮件,经过统计分析后创建了CCERT中文垃圾邮件过滤规则集(Chineses_rules.cf),目前该规则集已被上千个邮件服务器以及客户端有效地使用.……  相似文献   

2.
本文分析数据主要来自从CCERT垃圾邮件蜜罐网获取的中文垃圾邮件,用户举报信息以及CCERT应急响应系统接收和处理的垃圾邮件事件信息.CCERT反垃圾邮件小组利用"CCERT垃圾邮件蜜罐网"将发送到ccert.edu.cn域,而又不存在实际对应用户的方式获取垃圾邮件,经过统计分析后创建了CCERT中文垃圾邮件过滤规则集(Chineses_rules.cf),目前该规则集已被上千个邮件服务器以及客户端有效地使用.  相似文献   

3.
本文利用Rough集理论针对不一致和不完全数据,提出了一种基于匹配度和覆盖度的处理方法.数据实验证明了该方法的可行性和有效性.  相似文献   

4.
Rough集理论在数据约简中的应用   总被引:2,自引:0,他引:2  
Rough集是由Z.Pawlak于1982年提出的,它是一种新的处理模糊和不确定知识的数学工具.它能有效地分析不确定,不精确,不一致等各种不完备信息.其优点是无需任何关于数据的初始的或附加的信息,如统计学中的概率分布.而随着数据库系统中所包含的信息量地扩大,人们越来越认识到信息系统中数据急度膨胀的危害性,因此人们对数据进行约简的要求也越来越强烈.本文主要介绍Rough集的基本理论在数据约简中的应用.  相似文献   

5.
近年来,人们提出许多刻划不确定性的方法,Rough集理论是描述Fuzzy性和不确定性的一种新的数学工具.文中简要介绍了Rough集理论的基本概念,讨论了Rough集的性质及其Rough Fuzzy集的相似度量。  相似文献   

6.
随着垃圾邮件传播手段的不断变化,传统基于内容的反垃圾邮件技术正面临着严峻挑战,本文提出了一种基于smtp会话控制的主动式垃圾邮件过滤技术.该技术通过分析垃圾邮件的通信会话过程中的特征信息,在MTA会话连接的不同阶段实现垃圾邮件的识别与拦截,并设计了一个垃圾邮件过滤网关并进行过滤实验.实验结果表明,提出的技术具有良好的识别效率和准确率.  相似文献   

7.
垃圾邮件已成为当今邮件系统的主要问题,垃圾邮件发送者通过伪装邮件来逃避反垃圾邮件系统的检测.针对目前的垃圾邮件过滤器大多数单机运行,所能获得的数据和信息较少,效率较低的问题,本文提出了一个点对点(P2P)的无服务器的E-mail系统的体系结构,系统测试结果表明,该系统结构有效地实现了相似邮件的聚集,从而达到了过滤垃圾邮件的目的.  相似文献   

8.
邮件过滤是反垃圾邮件的一种重要方法,其中基于邮件内容的过滤又是一种重要的、有效的过滤手段.基于电子邮件是一种半结构化的数据,并且,电子邮件中主要包括的是文本信息,因此,本文将文本挖掘的分类技术和方法引入到邮件过滤系统模型中,以实现对垃圾邮件的过滤.  相似文献   

9.
经过20多年的发展,Rough集理论获得了广泛的认识和运用,特别在数据挖掘、知识发现的研究中发挥着越来越大的作用.属性约简是大数据集压缩冗余数据的关键技术,Rough集理论基于数据分类的原理,提出了属性约简判定理论,并发展了多种约简技术,使数据挖掘中的属性约简难题摆脱了依赖主观处理的阶段,得到了有效的处理,并向高效约简的方向发展.  相似文献   

10.
交互式中文垃圾邮件过滤系统是基于“统计”规则的过滤方法设计并实现的,它兼具基于规则过滤方法与机器学习,以及概率统计过滤方法的垃圾邮件过滤系统的优点,同时还增加了邮件用户与垃圾邮件过滤器之间的交互,利用用户对邮件判定是否正确的反馈信息动态调整过滤器,从而提高过滤准确度。系统框架整个交互式中文垃圾邮件过滤系统的结构如图1所示。(1)CCERT垃圾邮件样本数据库。我们将来自CCERT垃圾邮件蜜罐网、用户举报以及CCERT应急响应系统接收和处理的垃圾邮件,经过分析整理后创建了CCERT垃圾邮件样本集合。(2)规则生成模块。该模…  相似文献   

11.
Rough Set理论是一种新的处理模糊和不确定信息的数学工具。近20年来,Rough Set理论由于在知识发现等领域的成功应用而受到广泛关注,并得到飞速发展,已成为数据挖掘中的一个很重要的方法。作者讨论了Rough Set理论在数据挖掘过程中的应用,并对Rough Set理论在数据挖掘应用.中存在的问题和挑战提出了自己的见解。  相似文献   

12.
粗糙集理论作为智能信息处理技术的一个新成果.提供了一种对不确定、不完整数据进行分析的新方法.是现今计算机应用中一个新的非常重要且发展迅速的研究和应用领域.在知识发现、数据约简、决策支持、分类、模式识别和控制等领域中特别有效。本文首先对粗糙集基本概念和理论进行了介绍.给出了基于粗糙集的数据约简和决策支持方法。然后对实习学生教学情况初始评价表进行推理,获取了一些指导规则。这些在对实习学生的指导过程中有非常重要的作用。  相似文献   

13.
粗糙集理论是一种处理模糊和不确定知识的一种新型数学工具,在很多领域取得了成功的应用.但是经典粗糙集理论处理的分类必须是完全正确的,在实际应用中,缺乏对噪声数据的适应能力,为了克服这个缺点,提出一种变精度的粗糙集模型,以适应实际应用的需要.对变精度粗糙集理论的数据预处理、属性约简、值约简和规则提取等问题进行了分析和研究,提出属性约简算法和基于求核值属性的归纳值约简算法,并将其运用于医疗系统的手术诊断数据表的数据挖掘分析过程中,所得到的实验结果与专家诊断结果基本吻合,取得了较好的实际应用效果.  相似文献   

14.
利用标准的粗糙集方法来产生约简,即直接在原决策表的基础上计算所有的约简集,然后利用这些约简计算决策规则集合来分类未知对象。这种方法对于未知对象的分类不总是足够充分的,因为该方法没有考虑到约简集的属性部分可能是混乱、不规则的。动态约简是来自于在决策表的众多随机采样的子表中具有最大的出现频率的约简,在此意义上来说,利用动态约简来分类未知对象是最为稳定、可靠的。  相似文献   

15.
针对电子政务系统的风险决策过程中存在大量不确定、不完全信息等特征,在传统粗糙集的基础上,将BP神经网络模型引入到电子政务系统的风险验证体系中,研究识别出电子政务系统风险因素,并以所识别的风险因素为对象,建立一套风险验证关键指标体系,运用基于粗糙集-BP神经网络模型建立风险评价方法,得出了电子政务风险验证模型指标的可能性、各方面风险因素生成可能性和风险后果大小的评估级别。  相似文献   

16.
粗糙集理论能够有效地处理不完整、不确定和不精确的数据信息。文章在邻域粗糙集的基础上,引入了下边界作为属性冗余性的判断条件。在全部特征的前提下删除某一特征后,根据样本集合的正域变化情况来确定被删除特征的重要性,从而确定特征是否为冗余特征。文中所使用的数据集合来源于UC I数据集。通过实验可以看出:这种方法可以从大量的特征中有效地选择出重要特征。  相似文献   

17.
从图论的角度,研究粗糙集模型及决策表相对正域和决策规则.方法:将关系和集合用图表示,通过求图的子图以及两图是否相交来求解集合上、下近似;通过求带权图的子图求取决策表相对正域,以及决策规则.基于图论的粗糙集模型更形象更直观.本文提供了一个研究粗糙集模型的新方法.  相似文献   

18.
顾及粗糙集理论的CART改进算法及其应用   总被引:1,自引:0,他引:1  
CART算法是数据挖掘技术中的一种常用的方法,对CART技术产生、基本思路及主要挖掘步骤及其优缺点等进行了概略介绍,利用粗糙集理论求取属性重要度并对CART算法作了改进.最后给出了改进算法在教学中的应用实例.  相似文献   

19.
针对分簇式WSNs结构,提出基于免疫原理的簇内任务分解的WSNs轻量级入侵检测机制,建立簇内和簇头的双层相互协作的入侵检测模型。在簇内节点采用免疫遗传否定选择加速生成成熟免疫细胞集合;簇头采用粗糙集属性约简,建立入侵检测特征库,对数据包进一步入侵检测,并将新特征库更新簇内节点记忆免疫细胞集合。仿真结果证明本机制可提高检测率,节约了节点能耗,降低了误检率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号