首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
王倩  曾金  刘家伟  戚越 《情报科学》2020,38(3):64-69
【目的/意义】在学术大数据的应用背景下,对学术文本更加细粒度、语义化的分析挖掘日益迫切,学术文本结构功能识别成为科研领域的一个研究热点。【方法/过程】本文从段落的层次来识别章节结构功能,提出利用结合卷积神经网络和循环神经网络的特征对学术文本段落进行表达,然后进行分类。【结果/结论】文本提出的深度学习方法在整体分类结果上优于传统的机器学习方法,同时极大的减少了传统特征工程的人力需求。  相似文献   

2.
3.
[目的/意义]在阅读文献的过程中,研究流程是研究者需要特别关注的一个重要方面,自动识别学术文本中描述研究流程的段落对辅助文献阅读、学习研究设计等有着重要意义。[方法/过程]文章以自然语言处理领域为例,收集代表性会议论文构建数据集。分别基于传统机器学习模型、神经网络分类工具以及预训练语言模型构建分类器识别研究流程段落,然后对不同模型的分类效果进行评估,确定性能最优的模型。为进一步提升研究流程段落识别效果,在最优模型的基础上,基于ChatGPT进行了数据增强。[结果/结论]实验结果表明,在所有分类器中,SciBERT具有最好的研究流程段落识别效果。基于ChatGPT的数据增强可使SciBERT模型的分类性能进一步提高,最终准确率(Acc)和F1值分别达到了0.9414和0.9409。  相似文献   

4.
[目的/意义]从学术共同体的评论性引用视角出发,以引文全文本为基础,结合词频统计、深度学习等方法,探析引文文本中表征突破性评价的文本特征并构建自动识别模型以实现从海量文献中识别潜在突破性文献。[方法/过程]以诺贝尔生理学或医学奖获得者的关键文献以及Science十大科学突破主题的代表文献(医学领域)作为金标准突破性文献集并获取引用语句,对引用语句进行词频统计并结合人工筛选获取表征突破性评价的常用词。对引用语句进行人工标注,利用BERT、BIOBERT模型进行训练形成自动识别模型,并选择癌症领域进行实证分析。[结果/结论]结果表明,学术共同体在评价具有重大突破价值的文献时具有明显的文本特征;相较BERT模型,生物医学语言表示模型BIOBERT对突破性评价引用语句的识别能力明显增强,F1值为0.84。基于引用语句的自动识别模型能够较为精准地识别具有重要学术价值的文献并能在一定程度上实现早期识别和早期评价。  相似文献   

5.
孙广胜 《现代情报》2009,29(12):55-57,60
本文分析了中文网络信息资源开发利用过程中存在的问题和制约其开发利用的因素,并对网络信息资源开发利用相关策略进行了探讨。  相似文献   

6.
[目的/意义]随着Web 2.0环境下社交网络的普及,科技文献学术影响力的动态综合评价越发复杂且重要。[方法/过程]文章使用灰色关联分析法获得时间权重,并运用熵权法计算不同时间窗口下的指标权重,同时将传统计量指标及Altmetrics指标数据进行融合,构建双重赋权动态综合评价模型。[结果/结论]以2005—2017年"PLoS Genetics"期刊文献为研究对象进行实证分析,验证了该评价体系的可行性和有效性。对科技文献自发表后生命周期中各阶段时序影响力的变化进行分析,发现Altmetrics环境下的文献学术影响力先增后降,符合传统文献计量老化规律。从长远来看,被引频次是文献学术影响力的主要决定性指标,PDF下载量与HTML浏览量也在一定程度上体现了在线网络指标对学术影响力的贡献度,应从正式的学术交流与社会网络关注两方面协调提升文献的综合影响力。  相似文献   

7.
程齐凯  李信  陆伟 《情报科学》2019,37(7):41-47
【目的/意义】构建一个较大规模的学术文献词汇功能标准化数据集,并对其进行描述分析,以期为学术检 索、文献推荐和科学计量等应用研究提供更加科学合理的数据支撑。【方法/过程】在学术文本词汇功能框架的基础 上,针对“研究问题”和“研究方法”这两种领域无关词汇功能,生成学术文献词汇功能自动标引规则模板,开发相应 的词汇功能标注平台,对88 865篇计算机领域文献进行自动标引,并对得到的数据集进行整体分析、热点和趋势分 析以及研究方法特点分析。【结果/结论】得到一个包含23 221个不重复研究问题的Topic数据集、18427个不重复研 究方法的Method数据集和30 145个“问题-方法”对的Topic-Method数据集;人工检验准确率高于95%。此外,文 章还创新性地提出了研究方法的 “功能特点”,并进行了相关实践。  相似文献   

8.
学术文献中包含的大量有价值的知识往往无法在摘要中体现出来。本文提出一种基于位置加权的核心知识挖掘方法,旨在以句为知识处理粒度,抽取正文中的核心句子作为独立的知识单元。该方法通过量化句子间的关联,将正文表示成一个以句子为节点,句子间关联为边的文本关系网络,提出基于章节的位置加权算法,结合社会网络分析方法,挖掘出文本中核心知识单元部分的句子。实验结果表明,该方法可以实现对文章核心章节中重要句子的抽取,达到初步预期效果。  相似文献   

9.
以Web of Science和CNKI核心期刊为数据源,采用文献计量和可视化分析方法,从时间趋势、国家、机构、作者、学科和期刊等角度全景分析国际国内学术道德的研究态势.通过高频关键词及其共现聚类分析,揭示出当前研究热点包括学术规范制定和学术伦理研究、出版学术道德和学术期刊责任研究、学术不端现状和影响因素研究、高校学术...  相似文献   

10.
基于科技创新成果评价与管理的视角,研究科技期刊论文同被引文献数的科学内涵和学术价值。通过频数分析、回归分析与变异系数的差异性分析,对比研究引证文献数和同被引文献数的特征及评价功能。研究发现,引证文献数与同被引文献数既有正相关性,又有显著差异性,同被引文献数的内涵更为丰富。大数据环境下同被引文献数在时间上的反应速度比引证文献数快,且具有客观性、科学性和有效性等优势,具有很强的学术评价功能,涉及到期刊、论文、作者的学术影响力以及学科或选题的热度,可以作为学术评价的重要补充手段。  相似文献   

11.
12.
基于深度学习模型的摘要结构功能识别方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
  相似文献   

13.
【目的/意义】学术论文的结构功能是学术论文篇章结构和语义内容的集中体现,目前针对学术论文结构功 能的研究主要集中在对学术论文不同层次的识别以及从学科差异性视角探讨模型算法的适用性两方面,缺少模 型、学科、层次之间内在联系的比较研究。【方法/过程】选择中医学、图书情报、计算机、环境科学、植物学等学科中 文权威刊物发表的学术论文作为实验语料集,在引入CNN、LSTM、BERT等深度学习模型的基础上,分别从句子、 段落、章节内容等层次对学术论文进行结构功能识别。【结果/结论】实验结果表明,BERT模型对于不同学科学术论 文以及学术论文的不同层次的结构功能识别效果最优,各个模型对于不同学科学术论文篇章内容层次的识别效果 均最优,中医学较之其他学科的学术论文结构功能识别效果最优。此外,利用混淆矩阵给出不同学科学术论文结 构功能误识的具体情形并分析了误识原因。【创新/局限】本文研究为学术论文结构功能识别研究提供了第一手的 实证资料。  相似文献   

14.
柴文越  刘小平  梁爽 《现代情报》2023,(12):164-177
[目的/意义]梳理国内外新兴主题识别相关研究,总结不同方法的优缺点,归纳现有研究存在的问题,为新兴主题识别研究提供参考。[方法/过程]首先对新兴主题及其相关概念进行辨析;其次根据新兴主题识别的流程,从数据源及分析对象的选择、识别主题的方法、用于筛选新兴主题的特性与指标3个层面对相关文献集进行梳理与分析;最后,提出现有研究的局限与不足,并对未来发展作出展望。[结果/结论]新兴主题识别研究经过20余年的发展,已经形成了较为规范的研究流程及较为丰富的研究方法,但仍存在一定的不足。在理论层面,新兴主题的定义尚不明确;在数据集构建方面,数据源的选择与融合方式有待完善;在主题识别方面,研究方法时滞性较强,对语义关注和解释不足;在筛选指标方面,缺乏客观完整的评价体系。未来需要针对相关理论和研究方法进行更为深入的研究。  相似文献   

15.
【目的】 了解近10年来学术不端防范的研究现状,以期为学术不端防范的进一步研究提供有价值的参考。 【方法】 以中国知网数据库为统计源,检索2007—2016年学术不端防范研究的相关文献,对检索结果的发表年份、来源分布、作者分布、被索引情况、主要内容、研究理论方法、提出的观点等进行统计和分析。【结果】 我国学术不端防范的研究总体呈上升趋势,但研究的深度有待进一步挖掘,研究主要集中在高校和期刊出版机构,论文发表和检测也是研究的重点和难点。【结论】 学术不端防范研究应当关注高校这一研究阵地,加强对学术期刊的管理,加强对学术不端文献检测系统的研究,不断拓展研究的广度和深度。  相似文献   

16.
学术性文献内的图片具有确定信息需求、辅助滤检的功能,网络学术文献内的图片在上下文语境、大小、命名、格式、超链接等方面有着独特的特征,可以与网络广告、图标等干扰图片区分开来,便于实现自动识别和辅助检索。基于这样的理论,以Google的自动抓取为基础采用VC++进行系统开发,实现了对含图片的文献的检索并在结果页面上以缩略图的形式展示图片,并依此对检索重新排序。  相似文献   

17.
彭玉芳  陈将浩 《情报科学》2022,39(1):141-147
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科 研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度 学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标 数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校 验,最终生成学术文献“目标数据”。【结果/结论】本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融 合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献 数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息 层面到进入学术文献内容的数据层面。  相似文献   

18.
孟旭阳  白海燕 《情报杂志》2023,(11):161-167
[研究目的]面向科技论文摘要的语步自动识别研究成果越来越多,为推动该学术研究成果的加速应用,以更好的支撑知识化服务建设,以NSTL(国家科技图书文献中心)为例,开展模型效果测评与应用研究。[研究方法]针对NSTL实际应用条件、场景、数据特点等,制定多维度的测评方案,对目前较为先进的基于BERT深度学习模型的语步识别效果进行多维度测评和结果分析,并给出面向应用的策略和建议。[研究结论]测评分析结果表明,语步识别模型的准确率及在不同学科领域上的通用性有待进一步优化提升。在准确率上,不同语步的识别准确率存在较大差异,具体表现为方法和结论语步的识别效果较优,背景、目的和结果语步的识别效果较差。在面向学术检索系统的实际应用中,语步识别成果有较多的应用场景,可为学术搜索或知识化服务平台提供多层次的深度服务。  相似文献   

19.
国内外学术不端文献检测系统平台的比较研究   总被引:2,自引:1,他引:1  
如何防范学术不端的问题在党和国家科教兴国的全局工作中具有十分重要的地位,是关系到党和国家科学技术事业发展的问题之一.文章研究了国内各种学术不端文献检测系统平台的形式和方式,调查了国际上的各种类型的学术不端文献检测系统平台,并进行了一定的比较。结果表明,通过互联网组织和强大数据库后台支持运行的学术不端文献检测系统平台,在实际应用上有较大优势。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号