期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

台德艺谢飞胡学钢《合肥联合大学学报》2007,17(3):61-64

通过介绍文本分类的过程及其关键技术，讨论了文本表示、分类算法、分类器性能评价原理和方法；最后，指出了当前文本分类过程中存在的问题，并对今后的发展进行了展望．相似文献

2.

董露露《合肥师范学院学报》2017,35(6)

特征降维是文本分类的关键步骤之一.传统互信息特征选择方法只关注了文档频,未考虑词频因素,并且忽视了负相关特征对文本分类的重要作用,导致其在不平衡语料集上的分类效果较差.针对传统互信息方法存在的不足,提出一种改进的互信息特征选择方法,综合考虑词频因素及正、负相关特征对文本分类的影响,引入平均词频率和绝对值最大因子,克服传统互信息倾向于选择低频词、忽视负相关特征的缺陷.在不平衡语料集上的实验结果表明,改进的互信息能够有效提高文本分类性能. 相似文献

3.

多标记文本分类中信息增益特征选择方法研究

许朝阳《廊坊师范学院学报(自然科学版)》2012,12(5):46-48

针对信息增益特征选择方法没有很好考虑多标记的分布,在多标记文本分类中表现不佳的问题,用标记矩阵的协方差改善特征选择时标记之间的关联产生的影响,提高分类效果。最后通过实验证明,改进的信息增益特征选择方法具有可行性和有效性。相似文献

4.

基于ESA的文本分类算法研究

《洛阳师范学院学报》2016,(2):68-71

本文借助中文维基百科知识库,提出基于ESA算法的文本分类算法.并选取2015年3月5日在中文维基百科网站下载的主题文章,对其进行适当处理,将处理结果作为该算法使用的语义概念知识库.在复旦大学中文文本分类语料上显示的实验结果表明,该方法比纯粹的词袋模型方法效果要好. 相似文献

5.

粗糙集和神经网络在文本分类中的应用研究

卢向华胡燕《洛阳工业高等专科学校学报》2007,17(6):8-10

把粗糙集与神经网络结合,应用于文本分类,可以充分发挥两种方法的优势,取长补短,粗糙集理论可以有效地对样本集进行约简,从而简化了神经网络的结构,减少了网络的训练次数,学习速度和分类精度明显提高,并用仿真实验验证了此方法的有效性. 相似文献

6.

一种改进的KNN中文文本分类算法

杜琳娜闫光辉杨霞霞刘利松《教育技术导刊》2010,9(2):51-53

提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。相似文献

7.

文本自动分类研究进展 总被引：1，自引：0，他引：1

牛延莉张化《教育技术导刊》2008,7(4):24-26

通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法,最后对文本分类今后的发展进行了展望。相似文献

8.

朴素贝叶斯在文本分类中的应用

熊志斌刘冬《教育技术导刊》2013,12(2):49-51

朴素贝叶斯理论是一种典型机器学习技术,能够应用于文本分类中。运用朴素贝叶斯理论阐述了贝叶斯分类器的样本训练和分类计算的过程,构造了一个文本分类器。试验表明,朴素贝叶斯理论在文本分类中有较好的分类效果。相似文献

9.

文本分类技术在网络基础教学资源中的应用

陆红蕾《漯河职业技术学院学报》2012,11(2):50-52

文本分类是实现网络资源快速分类的一项关键技术。通过对文本分类、网络教学资源、基础教学网络环境进行分析,针对网络教学资源的特点,提出了一个Rocchio算法的网页自动分类模型,并在基础教学网络环境下进行了仿真实验。实验结果表明,该模型能获得较好的分类效果,适合于基础教学资源的分类。相似文献

10.

SVM算法在文本分类中的研究

胡荣罗庆云《衡阳师范学院学报》2006,27(3):97-99

SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。相似文献

11.

决策树ID3分类算法在文本分类中的应用研究

李楠杨彬彬《大连大学学报》2009,30(6):68-71

文本分类在自然语言分类中起着重要作用,将决策树ID3算法应用与文本分类,对数字图书馆的部分文本信息分类,提出一个基于ID3决策树的文本分类算法,取得了良好的实验结果。相似文献

12.

使用KNN算法的中文Web文本分类技术研究

曹勇吴顺祥《教育技术导刊》2007,(1)

对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。相似文献

13.

基于突发事件新闻网页的文本分类方法研究

王昌厚罗永莲《长治学院学报》2006,23(2):34-35

从对突发事件新闻结构特点的分析出发,进行了特定领域文本分类方法的探讨。其中根据文本特点,摒除信息量小的部分,将标题、首部等作为标引源,提高了分类速度。在特征抽取中综合考虑字与词对于文本分类的作用,提高了分类精度。相似文献

14.

浅谈“疏离文本”现象在中国现当代文学中的体现

张丹《佳木斯教育学院学报》2014,(8):80-81

随着中国现当代文学研究的逐步深入,越来越多的文学工作者投入到了中国现当代文学的研究工作中去。然而文本作为文学作品的基础,却被越来越多的人忽视,"疏离文本"是当前中国现当代文学中的主要现象。本文分析文本研究与中国现当代文学的发展,重点讨论了"疏离文本"现象在中国现当代文学中的体现,并提出了如何有效解决"疏离文本"现象的具体措施。相似文献

15.

基于交叉覆盖算法的文本分类研究

李家兵《滁州学院学报》2008,10(5)

中文文本分类是对中文按类别来进行分类。基于交叉覆盖算法的文本分类运用交叉覆盖算法作为分类器,能够实现对中文文本的分类。通过它和SVM(Support Vector Machine)分类器的对比实验,说明了交叉覆盖算法,相比于SVM分类器对中文文本分类效果更好。相似文献

16.

分类讨论思想在高考中的体现

苗大勇《中学生数理化(高中版)》2004,(4):8-10,30

分类讨论是一种重要的数学思想方法,又是解决数学问题的重要途径之一.本文将结合近几年高考试题探讨对分类讨论的考查要点,供大家参考. 相似文献

17.

数据挖掘与决策树J48算法在文本分类中的应用

《甘肃高师学报》2022,(5)

为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值. 相似文献

18.

数据挖掘与决策树J48算法在文本分类中的应用

《甘肃高师学报》2015,(5)

为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值. 相似文献

19.

基于模糊分类规则树的文本分类 总被引：2，自引：0，他引：2

郭玉琴袁方刘海博《东南大学学报》2008,24(3):339-342

针对传统的基于关联规则的文本分类方法在分类文本时需要遍历分类器中的所有规则,分类效率非常低的问题,提出一种基于模糊分类规则树（FCR-tree）的文本分类方法.分类器中的规则以树的形式存储,由于树型结构避免了重复结点的存储,节省了存储空间.模糊分类关联规则与一般分类规则相比,不仅包含了词条信息,还包含了词条出现频度对应的模糊集,所以FCR-tree的构建过程及树的结构不同于一般规则树CR-tree.为降低构建及遍历FCR-tree的难度,采用了构造多棵k-FCR-tree的方法.在搜索规则树时,如果结点中的词条没在待分类文本中出现,则不需要再搜索该结点引导的子树,大大减少了需要匹配的规则的数量.实验表明该方法是可行的,与遍历分类器的分类方法相比,分类效率有了明显提高. 相似文献

20.

文本分类中TF-IDF权重计算方法改进

隗中杰《教育技术导刊》2018,17(12):39-42

TF-IDF是文本分类中计算特征权重的经典方法,但其本身并未考虑特征词在文档集合中的分布情况,从而导致类别区分度不大。通过计算特征词类内密度与特征词在样本中均匀分布时整体平均密度的比值对IDF函数进行改进。实验结果表明,改进后的TF-IDF考虑了特征词内分布与在整体文档集中的分布,提升了对类别的区分能力,有效改善了文本分类效果。相似文献