首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
韩客松  王永成 《情报学报》2001,20(1):100-104
本文首先介绍了数据挖掘、文本挖掘和知识管理等概念,然后从技术角度出发,将知识管理划分为知识库、知识共享和知识发现三个阶段,分析了作为最高阶段的知识发现的关键技术和意义,最后指出在文本中进行知识发现是新世纪智能信息处理的重要方向。  相似文献   

2.
基于共现分析的文本知识挖掘方法研究   总被引:1,自引:1,他引:1  
从应用出发,在综合已有研究成果基础上,分析共现分析在文本知识挖掘中的主要作用,提出基于空间分布、时间分布和内外关联的文本知识挖掘的三种应用思路,研究利用共现分析挖掘文本知识的一般应用流程,并分析适用对象范围、适用的研究目标及应用的优缺点。  相似文献   

3.
在数字化学术图书馆中,对海量非结构化读者相关知识的管理问题开始成为学者感兴趣的研究领域.提出一种基于文本挖掘技术,对读者知识进行管理的具体方案.实验结果表明,该方案能够将读者知识进行有效提取、组织和共享,从而推动数字学术图书馆的知识管理水平和能力.  相似文献   

4.
文本挖掘工具述评   总被引:5,自引:0,他引:5  
简要介绍一些商业文本挖掘工具和开源文本挖掘工具,针对其中四款典型的开源工具进行详细的比较,包括数据格式、功能模块和用户体验三个方面;选取三种各具特色的工具就其文本分类功能进行测评。最后,针对开源文本挖掘工具的现状,提出几点建议。  相似文献   

5.
俞琰  陈磊  赵乃瑄 《图书情报工作》2019,63(10):134-142
[目的/意义] 为帮助高校师生充分利用网络招聘信息,提出基于大数据量网络招聘文本挖掘的课程知识模型及其自动构建方法。[方法/过程] 本文提出包含"岗位-课程-知识点"的三级课程知识模型,利用自然语言文本挖掘技术实现课程知识点模型的自动构建,并通过实验对其构建过程进行验证和分析。[结果/结论] 实验结果表明本文提出的模型及方法具有高度的可行性与有效性,可为高校和学生提供教学和学习参考。  相似文献   

6.
7.
基于超图的知识表示及检索相似性度量研究   总被引:4,自引:1,他引:3  
在分析传统的基于图论知识表示方法不足的基础上,引入超图进行知识表示。超图能够有效表达知识的多元关系,表达层次与非层次结构。针对知识检索问题,通过定义知识元素组成相似度、知识拓扑结构相似度,提出一种知识综合相似性度量方法。最后通过实验验证该方法的有效性。  相似文献   

8.
色彩作为承载中国传统思想观念、文化习俗、社会礼制的重要载体,是传统文化不可或缺的部分,全面探析明清时期色彩的演变发展、思想流变及其文化内涵,对弘扬传统色彩文化具有重要意义。文章以明清时期的4本典籍文本为语料,提出一种基于文本挖掘进行明清时期色彩知识探究的研究方法,通过实体标注、实体关系抽取、色彩演变分析、色彩与社会阶层关系探究,探索明清时期色彩的演变特征,在此基础上揭示其文化内涵。与传统方法相比,文章通过量化的方式更加清晰地展现了明清时期色彩的演变特征;通过分析文本内容,进一步发现明清时期色彩等级随着政治、经济、染色工艺的变化,呈现出动态变化的特点。分析结果得到历史学、艺术学相关研究资料的佐证,验证了方法的有效性。  相似文献   

9.
文本挖掘及其在信息检索中的应用   总被引:3,自引:0,他引:3  
文本挖掘是指利用数据挖掘技术,从大量的文本数据中提取感兴趣的、潜在的有 用模式和隐藏的信息。文章详细阐述了文本挖掘系统的组成、过程及相关技术,并介绍了文本 挖掘在信息检索中的应用。  相似文献   

10.
认为信息分析方法可以用于社会科学研究,具有客观、系统和定量的特点。内容分析作为一种典型的信息分析方法展示了这些特点。但它也具有抽样过程的人为性、手工标引的低效率、人工作业的低信度问题。网络时代出现的文本挖掘方法能够处理海量文献、处理非结构化数据,其研究品质远远高于手工信息分析方法。  相似文献   

11.
基于数字纸张的信息检索和数据挖掘技术   总被引:2,自引:0,他引:2  
随着数字纸张概念的提出和相关产业的日益发展,基于数字纸张的应用需求日益迫切,满足这些应用的软件解决方案中的一个核心内容就是数字纸张的内容管理,其中最基本最核心的两项技术是信息检索技术和数据挖掘技术,本文重点地阐述了这两项技术的最新应用成果。  相似文献   

12.
网络数据挖掘及其在面向Web的知识检索中的应用   总被引:6,自引:1,他引:5  
介绍了网络数据挖掘的含义和相关技术,并着重介绍了网络数据挖掘方法在面向Web的知识检索中的应用:通过对信息源内容与结构的挖掘,对用户访问记录的挖掘,对专家访问的挖掘,发现隐藏在网络数据流背后的知识关联和知识,形成特定知识库,支持知识检索。  相似文献   

13.
文本检索中的词汇控制研究   总被引:4,自引:0,他引:4  
概要分析文本检索系统中词汇控制的类型、特点和使用规律。  相似文献   

14.
全文检索算法设计及全文检索系统概述   总被引:10,自引:1,他引:9  
该文首先介绍了全文检索在我国的研究历程,然后阐释了三种全文检索算法,比较了彼此的优缺点,最后对国内的全文检索系统做了一个概要的介绍。  相似文献   

15.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

16.
吴育芳  陆春华 《晋图学刊》2010,(3):34-36,49
本文在介绍了Web挖掘的基础上,重点分析了Web文本挖掘的概念、过程及其关键技术,包括文本的特征表示与提取、文本的分类与聚类等。  相似文献   

17.
A known-item search is a particular information retrieval task in which the system is asked to find a single target document in a large document set. The TREC-5 confusion track used a set of 49 known-item tasks to study the impact of data corruption on retrieval system performance. Two corrupted versions of a 55,600 document corpus whose true content was known were created by applying OCR techniques to page images. The first version of the corpus used the page images as scanned, resulting in an estimated character error rate of approximately 5%. The second version used page images that had been down-sampled, resulting in an estimated character error rate of approximately 20%. The true text and each of the corrupted versions were then searched using the same set of 49 questions. In general, retrieval methods that attempted a probabilistic reconstruction of the original clean text fared better than methods that simply accepted corrupted versions of the query text.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号