首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
范宇中  张玉峰 《情报科学》2003,21(1):103-105
本文结合运用信息管理和人工智能的原理与技术,探讨了文本知识的自动分类方法,包括:自动归类与聚类方法、基于实例的学习分类方法和基于特征值的元学习方法。  相似文献   

2.
自动文本分类的可视化方法探讨   总被引:1,自引:0,他引:1  
陈旭毅 《情报科学》2007,25(10):1530-1533
自动文本分类方法是文本分类中非常重要的一种分类方法,本文着重从模型与方法的角度进行探讨。首先给出了一个自动文本分类的形式化定义,然后提出了自动文本分类的流程模型。接着,对流程中的四个部分进行具体讨论。自动文本分类的应用非常广泛,为了叙述方便,以商务数据为例进行讨论,并且选择实例作为典型案例对自动文本分类后的可视化进行分析和具体研究。  相似文献   

3.
马慧芳  郭治成 《情报杂志》2005,24(12):125-126
旨在研究文本自动分类在搜索引擎中的应用。它不仅可以提高搜索引擎的查全率和查准率,为用户提供分类信息目录。而且自动分类的好与坏,对后面的相关性排序过程也有一定的作用。  相似文献   

4.
提出一种基于文本聚类的开放式信息自动归类方法.它的主要特点是:适合自动归类不断增量的文档信息;不需要人为干预,完全靠自主学习的方式来确定各个主题的内涵范围:类别在聚类过程中动态产生.实验证明,该方法能实现增量信息的自动归类,且从评价函数的评价结果看,归类效果良好.  相似文献   

5.
高等学校科研机构在科教兴国的战略中发挥着重要的作用,扮演着骨干角色。数据挖掘是一个完整的数据存储、数据仓库和决策支持的统一体,广泛应用于零售、制造、通信、卫生保健、保险和运输等行业。本文利用数据挖掘中的聚类分析技术,提出了一种两步聚类算法。利用该算法可以将高校科研机构根据其历史数据和信息进行分类,科研机构的管理者根据分类的结果能够识别科研机构之间的异同.从而实现科研机构的分类管理,同时也能够给科研资源的合理分配提供指导。  相似文献   

6.
7.
李海蓉 《情报科学》2012,(6):852-857
简要介绍语义模板的概念,提出基于语义模板向量空间的文档自动分类模型。利用支持向量机(SVM,Support Vector Machine)分类算法对文档测试集进行基于语义模板空间、词向量空间的分类实验,实验结果表明,基于语义模板空间的文本分类性能比基于词向量空间的分类性能要高。  相似文献   

8.
李旗 《现代情报》2004,24(2):200-202,205
搜索引擎检索结果的文档列表通常过于庞大,给用户查找带来极大不便。作者在当前搜索引擎的工作机制基础之上,引入了智能代理知识库技术,加强了用户与系统的交互性,并自动对检索结果进行文档聚类,以一种导航的方式方便用户快速找到相关的文档。  相似文献   

9.
自动文本分类方法研究述评   总被引:2,自引:0,他引:2  
蒲筱哥 《情报科学》2008,26(3):469-475
在总结已经研究出的经典文本分类方法的基础上,对当前涌现出的一些新的文本分类方法进行了归纳,得出了当前研究的不足之处和未来发展趋势。  相似文献   

10.
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。  相似文献   

11.
自动分类技术在数字参考咨询服务中的应用   总被引:3,自引:0,他引:3  
杨永生  陈凌  许真玉 《情报科学》2006,24(2):239-242
本文介绍了自动分类技术在数字参考咨询服务系统中的应用,详细概述了自动分类技术的概念、作用及其方法,并加以总结。  相似文献   

12.
提出了一种图像分级分类方法。在该方法中,利用颜色数区分为照片和图画,利用Hough变换检测图像边缘,根据图像边缘中的直线比例区分人造物与自然物、图表与绘画,利用图像边缘的平均模糊度区分简笔画和工笔画。  相似文献   

13.
中文文献自动分类研究概述   总被引:1,自引:0,他引:1  
  相似文献   

14.
介绍了一种常用的文件类型HTML文件的文本信息预处理方法,该方法能够快速提取网页文本。实验表明,该预处理方法具有较好的分类效果。  相似文献   

15.
搜索引擎自动分类功能评价   总被引:2,自引:0,他引:2  
朱剑俊 《情报科学》2006,24(5):754-757
本文分析了搜索引擎的检索结果自动分类的功能。通过模拟真实环境的检索实验。比较分析了“中国搜索”和“搜狗”在该项功能上的特点、区别和用户使用情况,并对此做出评价。  相似文献   

16.
基于核聚类算法的高校图书借阅信息分类方法   总被引:3,自引:0,他引:3  
李盼池 《现代情报》2003,23(9):186-188
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于模式识别中核聚类算法的自动分类和统计分析方法。首先按照中图法所列22个大类对馆藏图书类型和借阅记录情况进行量化编码,然后对编码后的数据进行规整处理。以流通系统的读者数据库为底层数据支持,采用本文提出的方法开发出流量分类统计和预报应用系统。对大庆石油学院图书馆流通数据进行实际处理,结果证明了该算法的有效性和可靠性。  相似文献   

17.
文本自动分类技术研究综述   总被引:2,自引:0,他引:2  
文章从文本表示、特征选择、分类算法、常用基准语料以及评估指标等方面对近年来的研究成果进行综述并讨论。认为短文本分类和多语言文本分类管理是新出现的重要且紧迫的问题,并对这两个问题以及数据集偏斜、多层分类、标注瓶颈等几个关键问题进行重点讨论。最后总结并展望这些研究内容。  相似文献   

18.
中文文献自动分类研究   总被引:6,自引:0,他引:6  
本文简述了文献自动分类的问题,并提出了中文文献自动分类的一般模式,同时分析了实现中文文献自动分类目前所面临的一些问题。  相似文献   

19.
讨论了一种运用于搜索引擎中的多文档自动摘要技术。传统搜索引擎返回结果繁杂,常用的解决方案是使用聚类技术将内容相似的网页集合归类,然而聚类后的结果数目庞大,依然无法体现该类的主题。提出一种新的基于文本关系图的多文档自动摘要技术,对每类返回结果依主题思想自动提取多文档摘要,提高搜索引擎使用效率。分析了该系统的结构和算法,评价了实验结果,指出了未来的研究方向。  相似文献   

20.
陆丽娜 《现代情报》2008,28(3):171-172
本文主要从"图书自动分类"的设计与实现出发,讨论了它的发展概况及主要的研究内客和关键技术.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号