首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 545 毫秒
1.
面向引用关系的引文内容标注框架研究   总被引:3,自引:0,他引:3  
引文内容分析能够帮助揭示文献引用关系的深层语义内涵。本文梳理了目前已有的引文内容标注体系,归纳出构建引文分类体系的三个主要维度,即引文功能,引文重要性,情感倾向。以支持文献引用关系分析为目标,针对引文内容分析设计出一个引文内容标注框架,其中包括揭示引文关系抽象性质的引文分类标注体系,描述被引文献具体内容的引用对象标注体系,以及记录引文客观特征的引文属性标注体系。具体的标注实验体现了该标注框架的可用性。图1。表6。参考文献56。  相似文献   

2.
[目的/意义] 对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程] 总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果/结论] 目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。  相似文献   

3.
[目的/意义] 将引用内容分析与引文著录分析进行比较,旨在引起国内学者、出版商、图书馆、信息服务等相关人员和部门对引用内容研究的关注,促进引文分析理论和实践的全面发展。[方法/过程] 首先对引文著录与引用内容的相关概念进行分析,然后从引用频次的计算、引用极性的分类、引用动机的分析、引文网络中文献之间的关系、应用发展5个角度将引用内容分析与引文著录分析进行比较,得出引用内容分析相对引文著录分析的优势所在。[结果/结论] 与引文著录分析相比较,引用内容分析在科学评价和揭示科学技术发展的特征方面更合理,是引文著录分析的有力补充。  相似文献   

4.
学术文献引文推荐研究进展   总被引:1,自引:0,他引:1  
[目的/意义]学术文献引文推荐是指对于给定的学术文献,自动化地为其推荐合适的引文和参考文献。借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的漏引。[方法/过程]分析国内外引文推荐研究的最新进展,阐述引文推荐问题的演化过程,从局部引文推荐和全局引文推荐等方面对引文推荐进行梳理,重点归纳文档相似性、主题模型、翻译模型、协同过滤和混合推荐等5种引文推荐常用方法,并总结引文推荐常用数据集和测评方法。[结果/结论]已有引文推荐研究的主要问题在于未考虑用户偏好的动态变化性及研究领域的综合性,在用户研究和实际应用方面仍有所欠缺;未来引文推荐的研究可运用语义化表达方法和自然语言生成技术,从基于上下文的引文推荐和跨语言引文推荐等方面进行展开。  相似文献   

5.
[目的 /意义]针对历史古籍事件识别问题,对比序列标注方法和文本生成方法,探究两种方法在古汉语上的表现,构建模型实现历史古籍事件识别自动化,以提高面向历史古籍构建知识图谱的效率。[方法 /过程]选取《三国志》为原始语料,序列标注实验对《三国志》事件数据集进行BMES标注,构建BBCN-SG模型,文本生成实验构建T5-SG模型,对比两种方法的表现。接下来,构建RoBERTa-SG、NEZHA-SG模型展开生成模型的对比实验。最后,结合三个文本生成模型,融入Stacking集成学习的思想,构建Stacking-TRN-SG模型。[结果 /结论 ]在历史古籍事件识别建模问题上,文本生成方法的表现明显优于序列标注方法。而在文本生成方法中,RoBERTaSG模型的识别效果综合最好。Stacking集成学习能够大大提高生成模型的识别效果,构建的Stacking-TRN-SG模型达到70.35%的召回率,初步实现历史古籍的自动事件识别。  相似文献   

6.
[目的/意义]从学术期刊中抽取其中的理论是对文献进行内容分析的前提,实现理论名称识别的自动化可以提高内容分析的效率。[方法/过程]将理论识别视为一类命名实体识别问题,总结现有的命名实体识别的常用方法,提出一个基于语义泛化思想的命名实体识别方法,选取词性、知网义原等外部知识,采用CRF模型对《情报学报》1822篇论文的标题和摘要进行实验。[结果/结论]实验表明,识别准确率最高达到95.38%,但召回率较低;训练语料规模对性能影响较大,不同程度的语义泛化方法对准确率和召回率有复杂影响。如何选择语义特征、语义标注和语义消歧是需要解决的新问题。  相似文献   

7.
基于引文内容分析的引用情感识别研究   总被引:1,自引:0,他引:1  
[目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。  相似文献   

8.
基于引用频次开展的引文分析忽略了引文对施引文献的效用差异,依此展开资源评估、学术影响力判断难免受到“无效”引用干扰。为排除“无效”引文,提升测度及评价数据质量,文章从引文效用的角度,选择引文属性、功能、对象、情感等典型特征,建立引文标注框架。测试逻辑回归与支持向量机等方式对引文自动分类的效果,择优构建“效用视角下核心引文识别模型”。其中,为探索自动化分类方式,在数据标注阶段,除人工标引,还使用大规模预训练语言模型的对话系统ChatGPT进行自动分类标注,并进行建模效果测试,以期为引文自动分类方法及应用实践提供新思路。  相似文献   

9.
基于引用频次开展的引文分析忽略了引文对施引文献的效用差异,依此展开资源评估、学术影响力判断难免受到“无效”引用干扰。为排除“无效”引文,提升测度及评价数据质量,文章从引文效用的角度,选择引文属性、功能、对象、情感等典型特征,建立引文标注框架。测试逻辑回归与支持向量机等方式对引文自动分类的效果,择优构建“效用视角下核心引文识别模型”。其中,为探索自动化分类方式,在数据标注阶段,除人工标引,还使用大规模预训练语言模型的对话系统ChatGPT进行自动分类标注,并进行建模效果测试,以期为引文自动分类方法及应用实践提供新思路。  相似文献   

10.
[目的/意义]引文是施引文献与被引成果的纽带,反映了后继者的借鉴和肯定。本研究在传统题录关键词网络的基础上,创新地将引文上下文关键词作为研究材料,所构建知识图谱不仅能揭示文献主题的深层次信息,也能够反映受众主观筛选和利用文献的知识过程。[方法/过程]选取数字人文为研究领域,获取3个文献集和两个引文文本集,构建两个无向的关键词共现网络和两个有向的基于文献引证的关键词网络。通过共现网络,观察数字人文领域知识的吸收与扩散;通过引证关键词网络,观察数字人文的形成与转化。[结果/结论]研究揭示数字人文的研究重点、核心领域与核心技术,从受众的角度为数字人文领域未来研究提供借鉴和参考。  相似文献   

11.
[目的/意义] 为更好地提升基于内容的引文分析效果,对国内外引用对象相关研究进行调研总结,为引用内容分析研究提供借鉴。[方法/过程] 通过调研国内外引用对象相关研究,梳理引用对象的概念定义、分类体系、应用领域和自动化识别等方面研究进展,总结当前引用对象研究不足并提出未来发展方向。[结果/结论] 引用对象从语义层面评价文献学术研究的贡献和利用价值,为引文分析方法增加了重要维度。引用对象研究需要从理论、技术和应用三个方向进行深化:理论上,加强多维度引用对象特征的研究和分析;技术上,探索基于大规模语料的自动化识别方法;应用上,尝试基于引用对象的科研评价服务。  相似文献   

12.
[目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。  相似文献   

13.
[目的/意义]论文被引频次只能反映论文的宏观影响力,无法揭示论文在他人研究中的具体作用和影响,因此,本文提出从引用内容的主题和功能两方面对论文的影响力进行分析。[方法/过程]以2014年诺贝尔生理学或医学奖获得者J.O'Keefe的高被引论文为实例,首先,采用文献计量学方法对引用内容主题进行分析;对其,影响范围及领域进行可视化分析;其次,从引用性质和功能角度,将引用内容分成正面引用、负面引用和中性引用;最后,将中性引用进一步划分为3类,分别是研究背景介绍、理论基础和实验基础。[结果/结论]结果表明,共词分析可以很好地表达论文影响的主题领域;引用内容的分类可以提供一篇论文被引用的多方面原因。在本实验中没有负面引用,多于10%的引用为正面引用,大约50%的中性引用都是作者在研究背景章节中介绍与施引文献相关的研究工作。  相似文献   

14.
[目的/意义]引用语境是科学论文中包含引用的句子,是对引文的描述性或评价性文字。通过提取和分析引用语境中的线索词,可以了解引用语境的一般特征。[方法/过程]以Journal of Informetrics(JOI)期刊为例,选取人称代词、行为动词和连接词三类常用的线索词,分别计算它们在引用语境中的频次、占比和排序。通过比较各类线索词在引用语境和非引用语境中的存在度,识别引用语境中的常用句型和论证模式。[结果/结论]在JOI期刊中,引用语境主要表现出如下特点:侧重于第一人称和第三人称论述,既展现他人的工作,也展现作者的研究;偏重于研究方法类引用,常用的行为动词为"use"base"和"study";强调通过转折和列举等逻辑方式进行论证,最常用的连接词位"also"和"but"。分析引用语境中的线索词,对于更好地理解科学论文中的引用的功能和动机具有重要的价值和意义。  相似文献   

15.
全文本引文分析——引文分析的新发展   总被引:3,自引:0,他引:3  
对全文本引文分析法进行全面梳理,首先,将其提出的背景归纳为传统引文分析法的不足以及相关技术的发展;其次,介绍全文本引文分析的研究数据、研究方法及研究内容;最后,展望全文本引文分析法未来的研究方向,认为全文本引文分析作为一种微观的、基于全文数据的引文分析法,可以从根本上改变和发展引文分析和科学评价的理论与方法;随着结构化全文数据的普及,其将得到更大的发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号