首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
基于粗集理论和神经网络结合的数据挖掘新方法   总被引:13,自引:1,他引:12  
李仁璞  王正欧 《情报学报》2002,21(6):674-679
本文提出了一种基于粗集理论和神经网络的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简 ,然后使用神经网络对数据进行学习和预测 ,并同时完成属性的不一致约简 ,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明 ,该方法快速有效 ,生成规则简单准确 ,具有良好的鲁棒性。  相似文献   

2.
随着计算机的普及与快速发展,如何通过在批量数据中提取有效规则实现机器智能分类与推理,提高知识推理的有效性与准确率,成为当前知识服务领域的难题之一.文章基于本体(Ontology)的知识组织方式和粗糙集(Rough Set)理论的知识获取技术,针对批量数据的规则提取实现知识推理,提出知识推理模型ORSKM.ORSKM模型利用九元组构建领域本体,实现实例数据的语义化描述;从领域本体的属性中提取粗糙集的决策表,由决策表对领域本体关系进行领域知识知识库归约,获取领域知识相关的属性规则;通过粗糙集知识推理算法实现知识获取,最后通过实验对该知识推理模型进行验证.  相似文献   

3.
信息系统中一种面向粗糙集的数据挖掘方法   总被引:17,自引:2,他引:15  
程岩  黄梯云 《情报学报》2001,20(1):90-99
数据挖掘技术是信息系统的一个重要研究内容 ,它可以从大量数据中自动发现对决策有帮助的知识。许多数据挖掘技术仅仅适用于精确集 ,不适用于粗糙集 ,而现实中粗糙集是普遍存在的现象 ,因此开发出一种面向粗糙集的数据挖掘技术在信息系统的研究领域具有重要意义。本文结合粗糙集理论提出了一个信息系统的粗糙集模型 ,在此基础上设计出一个属性约简方法及从粗糙集中发现规则的算法 :Apriori_2。  相似文献   

4.
黄山 《信息系统工程》2012,(12):150-151,155
属性约简是粗糙集理论的核心内容之一。目前,从不同的观点已经提出了一些不完备决策表中粗糙集属性约简算法。但是,这些算法相对于完备决策表还是有待进一步考虑。为此,本文借助于完备决策表中冲突域的概念,设计一种在不完备决策表中的新的属性约简方法。该方法通过计算数据粒化后,冲突域中冲突对象的数目为衡量标准来判断某些属性集是否为属性约简。并且,通过理论证明了基于冲突域所求出的属性约简与基于正区域属性约简的是一致的。最后,通过仿真实验说明该算法是可行的。  相似文献   

5.
关联规则挖掘是数据挖掘领域的重要课题,但是,就评价关联规则是否有价值的依据,即兴趣度的度量方法,学术界没有一致的标准.传统的兴趣度度量方法包括支持度-置信度,提升度,改善度,有效度,影响度方法等.这些传统的兴趣度度量方法都存在各自的局限,本文首先比较分析了关联规则的客观兴趣度度量的相关研究成果,然后,针对它们的不足进行了改进,提出了两种比较有效的关联规则度量方法(New-lift,New-Improve),通过实验分析,进而提出新的度量框架,并实证了新方法的特征属性.  相似文献   

6.
联规则挖掘是数据挖掘和知识发现领域的重要课题,但就判定关联规则是否成立的依据,即兴趣度的度量方法问题,学术界没有一致的标准.既有的兴趣度度量方法包括支持度-置信度方法,提升度方法,卡方分析方法等.这些传统的兴趣度度量方法存在各自的局限,表现为缺乏客观标准,缺少统计依据,只能度量正向关系等方面.为了克服这些问题,本文提出了一种基于统计推断的新的兴趣度度量方法,并对该方法与传统的方法进行了比较,证明了该度量公式的渐进分布形式,指出了新方法的优点,实证了新方法的特征属性.该方法用于关联规则挖掘,在判断规则成立的标准上是客观的,可以判定正负关联两种类型,在实际应用上是方便的,具有可操作性,较之原有方法有一定的优势.  相似文献   

7.
本文应用粗糙集理论中等价关系的概念,结合知识系统细化和泛化的思想以及Apriori算法中逐层搜索迭代求取频繁项集的思想,对数据挖掘中的多值属性关联规则问题进行研究,提出一种新的多值属性关联规则挖掘算法Mqars.Mqars的主要特点是无需将多值属性转化为布尔型属性,可以尽早地约简非候选的频繁项集,方便快捷地计算出项集支持度,提高多值属性关联规则挖掘效率.论文给出了Mqars算法详细描述、具体实现过程和算法实例及分析.最后设计实验环节对Mqars算法与传统的Maqa算法在时间复杂度和算法效率方面进行比对和分析,分析与比对的实验结果表明了该算法的有效性.  相似文献   

8.
王效岳  白如江 《情报学报》2006,25(4):475-480
结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法。首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类。这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点。试验结果表明,与朴素贝叶斯、SVM、KNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本。  相似文献   

9.
数据挖掘及其在现代化图书馆中的应用   总被引:21,自引:1,他引:21  
数据挖掘技术是一种新兴的信息处理技术,在信息的利用和提取中发挥着日益重要的作用。本文介绍了数据挖掘的概念、功能和分类,在此基础上列举了数据挖掘技术在图书馆信息呆集、信息咨询、个性化服务、读者导读、书库管理、数字图书馆建设中的应用。  相似文献   

10.
本文针对分布环境的数据挖掘要求,提出了基于贝叶斯网络的分布数据挖掘模型DDMB。论文详细阐述了DDMB中属性多叉树的概念和通过属性多叉树来反映分布环境下各数据集属性总体特征的思想,介绍了基于移动Agent访问分布数据集来构建属性多叉树的方法,详细描述了由属性多叉树生成综合贝叶斯网络的算法,阐述了面向属性多叉树的贝叶斯网络结构学习和参数学习以及属性间依赖系数最小阈值的确定方法。实验结果表明,该模型有效地解决了原有分布环境下贝叶斯网络学习负担重、存储开销大、执行效率低等问题。  相似文献   

11.
数据挖掘中分类方法综述   总被引:3,自引:0,他引:3  
数据挖掘中的核心技术分类算法的内容及其研究现状进行综述。认为分类 算法大体可分为传统分类算法和基于软计算的分类法两类,主要包括相似函数、关联规 则分类算法、K近邻分类算法、决策树分类算法、贝叶斯分类算法和基于模糊逻辑、遗传 算法、粗糙集和神经网络的分类算法。通过论述以上算法优缺点和应用范围,研究者对 已有算法的改进有所了解,以便在应用中选择相应的分类算法。  相似文献   

12.
王煜  王正欧  王明春 《情报学报》2005,24(6):674-678
本文根据CHI值原理、粗集理论和决策树原理,提出了一种抽取Web文本分类规则的新方法。决策树分类方法具有出色的数据分析效率和容易抽取、易于理解的分类规则等优势,但对于维数达成千上万维的分类问题很难应用。因此本文先根据CHI值选择每个文本类中对分类贡献大的若干词条,然后采用粗集理论方法对选择的特征进行进一步提取,这样得到维数较小的文本特征向量空间,最后再使用决策树进行分类,从而既保证了分类精度又可很容易地抽取出利于理解的文本分类规则。  相似文献   

13.
信息的表征和测度方法及应用研究   总被引:7,自引:0,他引:7  
关于信息的概念 ,目前有许多说法。本文根据据“信息是对事物属性的表征”这一观点出发 ,提出了一种信息表征和测度的方法以及相应的信息测度公式 ,并讨论了信息测度公式的性质和这种信息表征和测度方法在基于内容的图像检索系统中的应用。  相似文献   

14.
基于粗糙集加权的文本分类方法研究   总被引:6,自引:0,他引:6  
文本自动分类是当前智能信息处理中一类重要的研究课题。本文分析了基于统计理论的文本分类的基本特点,提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式。这种新的加权方法,相对于广泛使用的逆文本频率加权方法,大大改进了文本样本在整个空间中的分布,使得类内距离减少,类间距离增大,在理论上将提高样本的可分性。最后利用支持向量机和K近邻两种分类器,验证了这种新的加权方法对分类效果确实有所提高。  相似文献   

15.
龚本刚  檀大水 《情报学报》2008,27(1):156-160
针对模糊环境下企业竞争情报系统绩效评价问题,文章以模糊数学和信息熵理论为工具,提出一种基于表现度的评价方法.文章综合考虑了企业竞争情报系统绩效评价中定性和定量两类指标,首先引入了表现度概念,对不同指标下表现度进行规范化处理;然后根据信息熵理论确定各指标权重,进而得到各企业竞争情报系统绩效的综合表现度和优先顺序;最后给出一个算例.算例表明:该方法不仅能很好地处理企业竞争情报系统绩效评价中定性和定量指标值,而且还充分考虑企业竞争情报系统绩效评价中的模糊性,使企业竞争情报系统绩效的评价过程更为科学、合理.  相似文献   

16.
基于模糊AHP理论的科学论文学术价值评审研究   总被引:7,自引:0,他引:7  
根据三角模糊数的概念构造判断矩阵,基于三角形模糊数比较原理进行层次单排序,得到模糊AHP决策模型。据此,可从问题性原则、前沿性原则、逻辑性原则、实验性原则对科学论文的学术水平进行定量计算,从而可以较全面地评价科学论文的学术价值。  相似文献   

17.
In this paper, we discussed the feasibility of early recognition of highly cited papers with citation prediction tools. Because there are some noises in papers’ citation behaviors, the soft fuzzy rough set (SFRS), which is well robust to noises, is introduced in constructing the case-based classifier (CBC) for highly cited papers. After careful design that included: (a) feature reduction by SFRS; (b) case selection by the combination use of SFRS and the concept of case coverage; (c) reasoning by two classification techniques of case coverage based prediction and case score based prediction, this study demonstrates that the highly cited papers could be predicted by objectively assessed factors. It shows that features included the research capabilities of the first author, the papers’ quality and the reputation of journal are the most relevant predictors for highly cited papers.  相似文献   

18.
基于潜在语义分析和改进的HS-SVM的文本分类模型研究   总被引:1,自引:0,他引:1  
张玉峰  何超 《图书情报工作》2010,54(10):109-113
为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法-基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。  相似文献   

19.
针对传统信息检索模型对不确定性知识处理的不足,提出一种基于粗糙集的信息检索改进模型,并以粗糙集技术为支撑,结合模糊集合理论,对查询进行泛化以提高查询性能,同时给出该模型的关键实现算法及性能评估方法。该模型能够提高信息检索的效率,具有较高的理论及应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号