首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.  相似文献   

2.
文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。  相似文献   

3.
介绍了基于决策树算法的几种分类技术,重点介绍了具有很大影响的ID3算法,对几种算法进行了总结比较。  相似文献   

4.
在现代研究生招生领域中应用数据仓库与数据挖掘技术,能发现各种潜在的有价值信息,为招生和培养提供有效的决策支持.以数据仓库技术为基础,利用数据挖掘进行知识发现,能够帮助导师从众多的考生中找出适合本专业研究的人选.在一定程度上实现了数据仓库的挖掘应用.  相似文献   

5.
SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。  相似文献   

6.
分类技术中的决策树算法分析   总被引:6,自引:0,他引:6  
介绍了解决分类问题的常用方法——决策树。并对决策树的原理及Quinlan的ID3、C4.5两种主要的决策树算法进行了分析。通过分析它们的基本原理以及主要特点,提出了对决策树算法改进的展望。  相似文献   

7.
文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。  相似文献   

8.
文本分类是实现网络资源快速分类的一项关键技术。通过对文本分类、网络教学资源、基础教学网络环境进行分析,针对网络教学资源的特点,提出了一个Rocchio算法的网页自动分类模型,并在基础教学网络环境下进行了仿真实验。实验结果表明,该模型能获得较好的分类效果,适合于基础教学资源的分类。  相似文献   

9.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

10.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的方法。本文重点介绍了决策树建立的基本原理,对算法所面临的问题进行了阐述,为数据分类研究者提供借鉴.  相似文献   

11.
在对数据挖掘决策树的基本概念和常用算法进行介绍的基础上,针对生成决策树的常见问题提出了相应的处理方法。  相似文献   

12.
总结了数据挖掘的基本方法、文本数据挖掘的关键技术,讨论了文本挖掘的定义和文本分类的一些形式,并对文本数据的数据挖掘算法进行了研究。  相似文献   

13.
决策树算法在数据挖掘中研究与应用   总被引:1,自引:0,他引:1  
随着社会的发展、经济的进步,各行各业对可视化数据挖掘需求越来越高。本文介绍了可视化数据挖掘的相关概念,分析了在可视化数据挖掘中决策树算法的相关理论,并预测了可视化数据挖掘的发展。  相似文献   

14.
通过对Web数据的特点进行详细的分析,在基于传统的贝叶斯聚类算法基础上,采用网页标记形式来有效地弥补朴素贝叶斯算法的不足,并将改进的方法应用在文本分类中,是一种很好的改进思路。最后实验结果也表明,此方法能够有效地对文本进行分类。  相似文献   

15.
决策树分类器是一个重要的数据挖掘问题,在数据流上建立决策树的关键问题是如何计算内部节点的最佳分裂标准。现有的算法有的不能处理数值型的属性,有的计算代价太高。本文采用将数值型的属性值分成适当的区间,根据它们gini index值的特殊性质,确定具有最大gini indes梯度的区间,因而可以快速地计算最佳分裂点,实现在流数据上快速地建立决策树。  相似文献   

16.
研究决策树算法ID3在计算机基础课成绩分析体系中的应用,利用决策树算法挖掘影响计算机文化基础课成绩的主要因素,找出数据的内在规律,并对挖掘结果进行分析,从中提取有用的信息,为改善该课程的教学效果提供科学依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号