首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
中文医学论文中中英文摘要一致性问题探讨   总被引:1,自引:0,他引:1  
中文医学论文中的英文摘要依据是该文章的中文摘要,内容必然应统一。英文摘要以准确无误地反映中文摘要内容为原则,简练、清晰、没有疏漏和错译。撰写英文摘要需字斟句酌,以便国际学者能准确抓住论文的主要信息。  相似文献   

2.
基于句子主题发现的中文多文档自动摘要研究   总被引:2,自引:0,他引:2       下载免费PDF全文
【目的/意义】目前在多文档自动摘要方面,研究者们主要关注于获取多文档集合中的重要主题内容,提出的很多自动摘要方法在提高摘要代表性的同时却忽略了文档中的潜在主题。【方法/过程】针对于多文档自动摘要中存在的冗余度较高且不能全面反映主题内容的问题,本文提出了一种基于句子主题发现的多文档自动摘要方法。该方法将多篇文档转换为句子集合,利用LDA主题模型对句子进行聚类分析与主题发现,并通过word2vec训练词向量计算句子的相似度;最终在主题之下通过TextRank算法来计算句子重要性,并结合句子的统计特征生成多文档集合的摘要。【结果/结论】通过人工测评的结果表明,本文提出的多文档自动摘要方法在主题覆盖性、简洁性、语法性等方面都取得了不错的效果。  相似文献   

3.
自动文本摘要技术综述   总被引:3,自引:0,他引:3  
随着互联网上信息爆炸式的增长,如何在互联网上有效地获取所需信息成为当前情报科学领域一个迫切需要解决的问题.为了更好地浏览和吸收互联网上的海量信息,自动文本摘要技术对文档进行压缩,压缩后的表示能够覆盖原文的所有主题且不重复.文章对目前单文档摘要和多文档摘要领域的一些最相关技术和方法做一个较为全面的综述性介绍,对该领域当前的一些最新发展趋势,如基于图排序的摘要方法也进行了简要的探讨.  相似文献   

4.
中文科技论文摘要的常见问题及修改对策   总被引:1,自引:0,他引:1  
中文摘要是科技论文的点睛之笔。目前科技论文的摘要往往存在三类主要问题,即研究背景性内容过多、没有研究目的及内容抽象空洞。修改此类摘要,首先要全面掌握文章主旨,然后运用一定的写作经验,对引言、正文及结果结论中的中心语句加以提炼,便可形成一篇既独立于全文又能全面概括其主要内容的摘要。  相似文献   

5.
摘要是学术论文的重要组成部分。它既有让读者快捷了解论文主要内容的作用,又有为科技文献检索数据库的建设和维护提供方便的功能。但目前不少期刊发表的论文,较为普遍地存在着重复、欠完整性、逻辑性、连贯性、和可读性等问题。本文结合分析《创伤外科杂志》2011年第1期到2012年第4期中文摘要的常见问题,提出责任编辑增强责任意识,与作者加强沟通,认真执行摘要编写规范,主编认真把关,坚持标准,是提高学术论文摘要编辑质量的有效途径。  相似文献   

6.
在中文微博数据的文本情感分类任务中使用机器学习方法 ,为研究不同的特征集对情感分类准确率的影响,综合了一元词特征、句法特征、微博特征、基于评价对象特征、词典特征用于支持向量机分类器中,通过准确率、召回率、F指数比较分析不同特征组合对于分类性能的影响。所提方法用于微博数据中关于药品二甲双胍的评论文本,实验结果表明,一元词特征对文本情感分类的准确率高于其他单类特征,而在与句法特征、微博特征、基于评价对象特征、词典特征的综合使用得到了最高的分类精度。  相似文献   

7.
苏志响  邵志清 《情报探索》2006,(12):60-61,64
在介绍经典统计量互信息和t-测试的基础上,提出一种基于上下文统计反馈模型的特征词自动抽取方法,使之更好地满足对大规模中文文本进行处理的需求。实验表明,在无需词典和语料库的前提下.该方法能够快速、准确地对大规模中文文本进行特征词抽取。  相似文献   

8.
尹桂秀 《情报理论与实践》2002,25(2):115-116,122
This article introduces a Chinese text automatic classification method, including its principle and classification process. The article focuses on some key theoretical problems, such as word classification, keyword collection and keyword matching.  相似文献   

9.
【目的】比较国内外科技期刊英文摘要语态使用差异,分析国内方面存在的不足及其成因,并提出改进思路,以助益中文科技期刊提高英文摘要编写质量、提升国际传播效果。【方法】选取34种中外权威科技期刊,从每种期刊中抽取2022年第1期前10篇研究性论文的英文摘要形成小型语料库,统计分析其语态使用情况。【结果】国内、国外期刊的语态使用表现截然相反:国内期刊总体上偏好被动语态,国外期刊则倾向于主动语态;两者在主动句/被动句数量比值以及主、被动句在总句数中的占比方面差距悬殊。【结论】国内中文科技期刊英文摘要编写未跟上国际文体变化新趋势,存在过度使用被动语态问题,相关标准和要求落后、翻译思维惯性顽固、写作教材观念过时是其重要成因。建议根据语步功能,合理使用主被动语态。  相似文献   

10.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

11.
欧阳群玲  袁铿  高摄渊 《学会》2010,(12):56-59
目的:为了提高医学院校的本科生、研究生撰写医学论文摘要的水平。方法:针对目前医学论文摘要写作中存在的共性问题,采取从总的写作规范、原则到一般分类、特点及举例分析方法。结果:作者阐述了医学论文摘要的写作方法和技巧。结论:本文具有一定的科学性和实用性,对广大本科生、研究生和医务工作者具有指导作用和参考价值。  相似文献   

12.
微博比较研究   总被引:1,自引:0,他引:1  
李燕萍 《情报杂志》2012,(3):77-83,69
分析比较新浪和腾讯微博网站的特点,对其内容变量、转发和评论数以及发博途径进行实证分析;对转发数和评论数、粉丝数、关注数和博文数,分组进行两两比较,利用SPSS统计软件,采用相关分析等方法,统计分析每个微博网站的用户关系和行为特征,研究发现转发数和评论数、粉丝数、关注数和博文数,每组数据两两之间,都具有一定的正相关性,认为影响和制约微博信息传播的基本要素有两点,一是用户本身的人际关系社会网络;二是微博信息。为微博网站的用户行为特征和信息传播机制研究提供理论依据。  相似文献   

13.
中文文献自动分类研究   总被引:6,自引:0,他引:6  
本文简述了文献自动分类的问题,并提出了中文文献自动分类的一般模式,同时分析了实现中文文献自动分类目前所面临的一些问题。  相似文献   

14.
为丰富微博转发机制的研究,引入企业官方微博作为研究对象,探究微博的内容文本特征、形式化特征及时间性特征对微博转发影响的大小及影响规则。分析汇总影响微博转发的全特征集合,在此基础上进行特征选择和微博转发预测,并对不同产品的微博转发预测模型进行对比分析,以期挖掘各产品自适性的转发影响因子,为企业微博营销提供策略支持。  相似文献   

15.
微博文本聚类是依据微博主题不同将描述同一类主题的微博文本汇聚到一起的过程。由于微博文本非常短,在使用常规的机器学习方法对微博短文本进行聚类时,常会出现严重的数据稀疏问题,继而对聚类性能产生影响。分析了中文微博文本的数据稀疏特征,并基于这一特征分析比较了几种中文微博文本表示及聚类方法,为中文微博文本聚类分析的难点问题提供了一定的解决途径。  相似文献   

16.
林国艳 《内江科技》2011,32(11):53-54
摘要在一篇论文中的位置举足轻重摘要书写规范与否.决定文章能否拥有更多的读者.同时也是让世界了解中国学术研究的良好途径本文介绍了摘要的概念及其重要性,论述了学术论文中共文摘娶书写的要点,旨在总结和归纳其写作特点,给广大论文写作者以启示.  相似文献   

17.
18.
谭荧  唐亦非 《情报科学》2020,38(4):23-27
【目的/意义】将知识抽取的粒度细化到知识构成的最小单元--知识元,能提高知识获取的效率和精准度。【方法/过程】本文利用命名实体识别和事件抽取技术,探索了在科学文献中自动抽取事实知识元的方法。【结果/结论】实验结果表明,该方法能有效识别科学文献中的事实知识元,自动抽取效果出色。  相似文献   

19.
越来越多的研究者认识到维基百科是知识获取的有效知识源,然而维基百科站点内部现有的搜索引擎没有充分利用其丰富的语义信息,因此,本文对面向中文维基百科的检索模式进行了对比研究。实验表明,本文提出的基于分类体系的语义检索模式在检准率、检全率以及检索速度方面能取得更好的效果,让用户更充分地利用到中文维基百科这个大规模知识库。  相似文献   

20.
在文本自动分类中,目前有词频和文档频率统计这两种概率估算方法,采用的估算方法恰当与否会直接影响特征抽取的质量与分类的准确度。本文采用K最近邻算法实现中文文本分类器,在中文平衡与非平衡两种训练语料下进行了训练与分类实验,实验数据表明使用非平衡语料语料时,可以采用基于词频的概率估算方法,使用平衡语料语料时,采用基于文档频率的概率估算方法,能够有效地提取高质量的文本特征,从而提高分类的准确度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号