首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
刘茵  李弼程 《情报学报》2008,27(2):235-243
自动文摘系统的评测是自动文摘技术研究与发展的关键部分.随着摘要技术的快速发展,国外学者十分重视评测技术,研究工作也如火如荼,而国内相关工作相对贫乏.文摘评测对文摘系统的性能有重大影响,对自然语言处理、信息检索等相关技术有着促进作用.本文详细介绍了文摘评测的两大方法:内部评测和外部评测,并对多年来文摘评测中应用的关键技术做了简要总结,最后指出文摘评测面临的挑战及未来需要努力的方向.  相似文献   

2.
3.
一种使用自动聚类思想的自动文摘方法   总被引:5,自引:0,他引:5  
杨建林 《情报学报》2001,20(5):532-536
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 ,最后从候选段落类中选出文摘句构成文摘  相似文献   

4.
自动文摘综述   总被引:21,自引:1,他引:21  
本文概述了自动文摘的发展历史和研究状况 ,给出当前自动文摘领域主要的研究方法和策略 ,剖析了它们的优点和不足。进一步结合自动文摘自身的特点和难点 ,提出近期自动文摘的研究重点是基于篇章话语形式的浅层分析方法生成指示型文摘。  相似文献   

5.
自动文摘的生成方法与评价研究   总被引:1,自引:0,他引:1  
林莉 《图书馆学刊》2009,31(5):94-95
自动文摘系统一般包括基于理解的自动文摘和基于统计的自动文摘两大类。主要论述了从自动文摘建立的方法和自动文摘的评价方法。  相似文献   

6.
基于全信息词典的自动文摘系统研究与实现   总被引:3,自引:1,他引:2  
本文根据文摘与文本结构的关系,提出了一个以文摘框架为核心的文摘系统模型。系统的运行是建立在一部对词语进行了语法、语义、语用三个层面描写的全信息词典的基础上。文本分析器在其作用下,能有效地对与文摘有关的文本部分进行分析,填充预定的文摘框架,最后生成风格一致的文摘。基于上述理论的研究,设计并实现了计算机病毒领域的自动文摘实验系统,其效果较为理想。  相似文献   

7.
曹洋  成颖  裴雷 《图书情报工作》2014,58(18):122-130
探讨基于机器学习的自动文摘研究中的特征选取、算法选择、模型训练、文摘提取和模型评测等主要过程;重点分析3种主要的机器学习算法:朴素贝叶斯、隐马尔科夫和条件随机场,阐释3种算法的基本思想,在对相关研究进行系统梳理的基础上,给出作者的思考;对3种机器学习算法在训练方法、协同训练与主动学习、类别平衡以及词汇分布等方面存在的共性问题进行深入讨论并提出未来的主要研究方向。  相似文献   

8.
自动文摘系统评价方法的研究与实践   总被引:5,自引:2,他引:5  
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 ,最后提出并实践了一种参照Turing测试的思想进行自动文摘系统评价的方法  相似文献   

9.
本文针对目前的机器翻译系统中存在的一些问题, 提出了将自动标引和自动文摘应用于机器翻译的设想, 并分析了随之带来的好处。  相似文献   

10.
杨建林 《情报学报》2001,20(4):460-463
本文提出了几个可以改善中文自动文摘系统的文摘效果的措施 :1 将字频统计方法和词频统计方法有机结合起来 ;2 进一步研究人工文摘中理解性文摘句的形成机理 ,完善仿人算法 ;3 将自动聚类的方法引入自动文摘研究。  相似文献   

11.
我国元数据研究论文的统计分析   总被引:9,自引:0,他引:9  
近几年来元数据研究随着互联网的迅猛发展而得到广泛关注。本文从元数据研究论文的年代分布、空间分布、应用学科领域、主题分布及作者分析着手,力图提供一些元数据研究的有益信息。  相似文献   

12.
我国数字图书馆研究论文的统计分析   总被引:18,自引:1,他引:18  
信息技术的飞速发展,推动着图书馆的剧变。数字图书馆作为这剧变的产物,正日益受到图书馆界乃至社会的关注,成为图书馆学理论研究和实践探索的热点和重点。本文通过对1995年以来我国数字图书馆研究论文的来源、年代和空间分布、主题、作者等各方面进行统计分析,探讨近年来我国数字图书馆研究现状和主要发展趋势,以推进我国数字图书馆的可持续发展。  相似文献   

13.
本文通过检索中文科技期刊数据库和中国期刊全文数据库,采用文献计量学的方法,对1997-2005年我国数字信息保存研究论文的发表时间分布、期刊分布、论文作者和主题内容进行统计分析,以期为该领域的深入研究提供数据参考和借鉴.  相似文献   

14.
运用文献计量学的方法,从研究论文的年代分布、来源期刊、核心作者和内容主题等角度,对1993-2010年度我国公共借阅权研究论文进行分析,以期为我国公共借阅权研究提供参考。  相似文献   

15.
文章选择图书馆学领域影响力较高的两种期刊《中国图书馆学报》和《大学图书馆学报》为分析对象,对两刊2000—2019年间登载的主题词中含有“图书馆”的文章进行统计分析,借以梳理20年间的研究热点,划分研究阶段,并对21世纪以来“图书馆”主题研究的特征进行总结。同时,在此基础上,对本领域未来的发展方向提出建议。  相似文献   

16.
自动标引研究的回顾与展望*   总被引:3,自引:0,他引:3  
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。  相似文献   

17.
我国竞争情报研究论文的统计分析   总被引:16,自引:0,他引:16  
本文对《中国学术期刊全文数据库》1994年—2004年我国有关竞争情报研究的论文,共886篇进行了统计分析,主要统计了论文年代分布、论文主题分布、论文期刊分布、论文的作者分布、著者合作度、发文机构等,并对以上数据进行了比较详细的分析,同时就当前我国竞争情报研究论文的现状进行了总结,指出了存在的问题。  相似文献   

18.
SCI收录我国期刊的统计分析与研究   总被引:4,自引:0,他引:4  
科学引文索引(SCI)是美国科学信息研究所(简称ISI)编辑出版的一部世界著名的期刊文献检索工具。SCI创刊于1961年,当时仅收录了613种期刊,今天的SCI(包括外围刊)已收录了全世界出版的涉及数、理、化、农、林、医、生命科学、天文地理、环境、材料、工程技术等150多个学科领域的5900余种期刊。SCI选刊标准严格,选刊原则明确,在对期刊总  相似文献   

19.
国内文本分类研究论文的统计分析   总被引:1,自引:0,他引:1  
介绍文本分类是一个跨信息检索、机器学习和计算语言学的综合研究领域,是信息处理的重要研究方向,指出它在自动标引、信息检索、文本过滤和文献组织等领域中有着广泛的应用;并通过应用文献计量学的方法对1998-2005年国内文本分类的研究论文进行统计分析,探讨近年来我国文本分类研究现状和主要发展趋势。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号