共查询到19条相似文献,搜索用时 78 毫秒
1.
本文介绍了几种自动标引加权方法,以及把这几种方法应用于汉语文献自动标引试验的情况,给出了试验的有关数据、基于数据的分析和推出的结论,并对汉语科技文献自动标引中的若干问题进行了探讨。 相似文献
2.
引文主题与源文献主题具有相关性。基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法。具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词。本文还对此法的可行性进行了测试,并提出了改进方法。 相似文献
3.
4.
图书标引是图书检索的前提和基础,把图书或摘要标引成概念图的形式,将有利于满足基于自然语言表述的图书检索需求。从科技类文献摘要出发,通过手工标引,总结常用的概念间关系作为概念图标注的关系集合,结合叙词表构造术语部件库,以便辅助术语识别,用MBL方法进行概念关系构建,在此基础上,提出了一个概念图生成算法,并开发了一个概念图半自动标引的实验原型系统。原型系统的实验表明,该种概念图半自动标引方法获得了较高的正确率。 相似文献
5.
6.
7.
面向概念挖掘的文本层次模型研究 总被引:1,自引:0,他引:1
针对当前Web文本挖掘工具的不足之处,提出了一种基于层次结构、面向概念挖掘的模型,即文本层次模型。该模型具有数据源适应性强、结构灵活、可操作性强、用途广泛优点,具有很强的实用性和一定的可扩展能力。图2。参考文献13。 相似文献
8.
基于EMM中文抽词算法的XMARC主题信息挖掘 总被引:4,自引:0,他引:4
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为“词首 长词匹配 短词推进”自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间。最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性。 相似文献
9.
基于Web挖掘技术的信息检索系统设计与实现 总被引:2,自引:0,他引:2
本文详细介绍一个基于Web文本挖掘技术的信息检索系统的设计与实现。基于Web文本挖掘技术的信息检索技术融合了文本挖掘的思想,它将单一的资源发现或者单一的信息提取的传统的信息检索方法结合起来,从而达到在WWW发现资源并将其中的信息提取出来进行处理的目的。 相似文献
10.
11.
一种用于主题提取的非线性加权方法 总被引:15,自引:0,他引:15
主题提取是文本处理的一项重要工作。本文首先分析了主题抽取中加权方法形成时的一些定量问题,然后提出了主题相关词一种非线性加权处理方法,对比实验结果显示它不仅是一种比较稳健的方法,而且能在一定程度上提高主题提取的正确率。 相似文献
12.
13.
统计分析法自动标引的改进 总被引:12,自引:2,他引:10
情报检索的目的是为用户服务,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法,对其权值设计予以重新考虑,并与文献词频统计相结合,使分词与标引相统一,标引词更好地反映文献主题概念,提高检索效率。 相似文献
14.
学科门户智能搜索引擎的设计与构建——农业史门户搜索引擎的实验 总被引:1,自引:0,他引:1
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论. 相似文献
15.
16.
Web挖掘技术在电子商务中的应用研究 总被引:16,自引:0,他引:16
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。 相似文献
17.
简论隐匿新闻源主体中的道德问题 总被引:1,自引:0,他引:1
在隐匿新闻源主体的行为中,主要关涉的道德问题是:隐匿的根据是什么?如何把握好隐匿的度?当隐匿行为追求的利益与其他利益发生冲突时,道德上如何选择?选择的理由是什么?本文对这些问题在已有研究的基础上作了进一步比较系统的回答。 相似文献
18.
全国中文机读书目主题标引格式问题分析 总被引:9,自引:0,他引:9
中文机读书目主题标引格式的不统一 ,会产生书目主题格式多样的弊端。其主要原因是由于叙词法后组式标题只能套录标题法先组式标题格式。因此 ,必须统一中文书目主题标引格式。表 2。参考文献 8。 相似文献
19.
基于作者中文图书主题标引的工作实践,重点阐述了中文图书主题标引工作中的主题词的查找、在版编目数据的利用以及标引工具书的使用。同时,就标引人员如何提高中文图书主题标引质量谈了自己的看法。 相似文献