共查询到20条相似文献,搜索用时 15 毫秒
1.
本文结合运用信息管理和人工智能的原理与技术,探讨了文本知识的自动分类方法,包括:自动归类与聚类方法、基于实例的学习分类方法和基于特征值的元学习方法。 相似文献
2.
自动文本分类的可视化方法探讨 总被引:1,自引:0,他引:1
自动文本分类方法是文本分类中非常重要的一种分类方法,本文着重从模型与方法的角度进行探讨。首先给出了一个自动文本分类的形式化定义,然后提出了自动文本分类的流程模型。接着,对流程中的四个部分进行具体讨论。自动文本分类的应用非常广泛,为了叙述方便,以商务数据为例进行讨论,并且选择实例作为典型案例对自动文本分类后的可视化进行分析和具体研究。 相似文献
3.
旨在研究文本自动分类在搜索引擎中的应用。它不仅可以提高搜索引擎的查全率和查准率,为用户提供分类信息目录。而且自动分类的好与坏,对后面的相关性排序过程也有一定的作用。 相似文献
4.
提出一种基于文本聚类的开放式信息自动归类方法.它的主要特点是:适合自动归类不断增量的文档信息;不需要人为干预,完全靠自主学习的方式来确定各个主题的内涵范围:类别在聚类过程中动态产生.实验证明,该方法能实现增量信息的自动归类,且从评价函数的评价结果看,归类效果良好. 相似文献
5.
高等学校科研机构在科教兴国的战略中发挥着重要的作用,扮演着骨干角色。数据挖掘是一个完整的数据存储、数据仓库和决策支持的统一体,广泛应用于零售、制造、通信、卫生保健、保险和运输等行业。本文利用数据挖掘中的聚类分析技术,提出了一种两步聚类算法。利用该算法可以将高校科研机构根据其历史数据和信息进行分类,科研机构的管理者根据分类的结果能够识别科研机构之间的异同.从而实现科研机构的分类管理,同时也能够给科研资源的合理分配提供指导。 相似文献
6.
7.
简要介绍语义模板的概念,提出基于语义模板向量空间的文档自动分类模型。利用支持向量机(SVM,Support Vector Machine)分类算法对文档测试集进行基于语义模板空间、词向量空间的分类实验,实验结果表明,基于语义模板空间的文本分类性能比基于词向量空间的分类性能要高。 相似文献
8.
搜索引擎检索结果的文档列表通常过于庞大,给用户查找带来极大不便。作者在当前搜索引擎的工作机制基础之上,引入了智能代理知识库技术,加强了用户与系统的交互性,并自动对检索结果进行文档聚类,以一种导航的方式方便用户快速找到相关的文档。 相似文献
9.
10.
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。 相似文献
11.
12.
提出了一种图像分级分类方法。在该方法中,利用颜色数区分为照片和图画,利用Hough变换检测图像边缘,根据图像边缘中的直线比例区分人造物与自然物、图表与绘画,利用图像边缘的平均模糊度区分简笔画和工笔画。 相似文献
13.
14.
介绍了一种常用的文件类型HTML文件的文本信息预处理方法,该方法能够快速提取网页文本。实验表明,该预处理方法具有较好的分类效果。 相似文献
15.
搜索引擎自动分类功能评价 总被引:2,自引:0,他引:2
本文分析了搜索引擎的检索结果自动分类的功能。通过模拟真实环境的检索实验。比较分析了“中国搜索”和“搜狗”在该项功能上的特点、区别和用户使用情况,并对此做出评价。 相似文献
16.
基于核聚类算法的高校图书借阅信息分类方法 总被引:3,自引:0,他引:3
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于模式识别中核聚类算法的自动分类和统计分析方法。首先按照中图法所列22个大类对馆藏图书类型和借阅记录情况进行量化编码,然后对编码后的数据进行规整处理。以流通系统的读者数据库为底层数据支持,采用本文提出的方法开发出流量分类统计和预报应用系统。对大庆石油学院图书馆流通数据进行实际处理,结果证明了该算法的有效性和可靠性。 相似文献
17.
文本自动分类技术研究综述 总被引:2,自引:0,他引:2
文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。 相似文献
18.
19.
20.