共查询到19条相似文献,搜索用时 78 毫秒
1.
基于引文内容分析的高被引论文主题识别研究 总被引:1,自引:1,他引:0
基于被引次数的引文分析无法直接揭示论文的研究内容,利用关键词或从标题、摘要和全文中抽取的主题词很难客观反映论文的被引原因。本文以碳纳米管纤维研究领域的高被引论文为研究对象进行引文内容抽取和主题识别,经人工判读验证:基于引文内容分析的高被引论文识别的核心主题能够较好地揭示高被引论文的被引原因(引用动机),而且与论文的研究内容相符合;与基于全文、基于标题和摘要的主题识别相比,在引文内容分析基础上识别的主题具有更好的主题代表性,能够有效揭示被引文献的研究内容,是对原文相关信息的重要补充。本文的实验表明基于引文内容分析的高被引论文主题识别是可行而且有效的。图4。表4。参考文献31。 相似文献
2.
利用引文内容进行主题级学科交叉类型分析 总被引:1,自引:0,他引:1
[目的/意义]针对学科交叉宏观研究不能刻画学科交叉主题,以及学科交叉微观研究仍处于主题挖掘研究阶段的现状,从内容层面解决主题学科交叉度计算问题,并构建学科交叉分类的量化标准。[方法/过程]首先,采集学术论文并解析引文内容;利用术语集获取术语和术语主题。然后,统计引文内容中的主题术语重复率。接着,计算学科间的主题学科交叉度。最后,基于主题学科交叉度分布熵,进行分类并分析。[结果/结论]研究结果表明:①六个学科难以与医学在实践应用知识层面进行学科交叉;医学的理论基础与六个学科有明显的学科知识交叉。②学科交叉存在三种类型分别为:界内交叉、工具型交叉和界外交叉。综上,通过引文内容中的术语可以有效地计算主题学科交叉度,定量地研究学科交叉类型。 相似文献
3.
4.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。 相似文献
5.
6.
7.
从5种国家一级学术期刊中选择理论型论文、实验型论文、综述型论文共300篇,统计引文共7857篇。对7857篇引文在三种体裁论文中的引言、本论、结论各部分分布的数量和被引用的内容进行详细调查。结果表明:引文在论文各部分分布的数量与论文的体裁形式有关,被引用内容体现了学科上的相关性、横向上的对应性和纵向上的继承性。 相似文献
8.
基于C-value与TF-IDF的文献簇主题识别研究 总被引:1,自引:0,他引:1
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一.引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征.本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法.实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别. 相似文献
9.
科学引文网络反映了科学知识的动态演化,作为一个复杂的网络系统已得到广泛研究。针对引文网络中主题不明确和热点问题不易跟踪的问题,提出了引文网络中的舆论评价计算方法和网络社区主题提取与表示方法。首先采用正则表达式和模板匹配方法提取元数据;并计算文献作者对参考文献的舆论评价,建立带有舆论评价权值的文献引用网络,并对网络中的突现语义进行描述;然后以此网络结构为基础,结合信息熵和网络中文献重要性权重改进TDIDF算法,计算得到每个社区主题的关键词概率描述,从而得到社区主题。本文的方法和实验对解释引文网络的演化、社区主题发现、文献的共享等有借鉴意义。 相似文献
10.
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望。[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融。未来应针对以上问题做出相应改进与深入探究。 相似文献
11.
12.
[目的/意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法/过程]选取中国知网(CNKI)数据库及万方数据知识服务平台作为文献来源,检索并筛选相关文献,通过人工判读提炼出基于主题模型的科技文献主题发现及演化研究的分析流程,并采用文献分析法对流程中国内研究人员所使用到的策略、方法、分析手段等进行归纳和总结。[结果/结论]研究已初具规模,形成较为完整的分析流程,同时各个流程环节上所涉及到的策略、方法和分析手段较为多样化。另外,也存在着一些问题:主题模型方法在科技文献领域的应用尚且不成熟,主题数目固定,缺少对主题模型应用效果的评价方法与准则。 相似文献
13.
[目的/意义] 为更好地提升基于内容的引文分析效果,对国内外引用对象相关研究进行调研总结,为引用内容分析研究提供借鉴。[方法/过程] 通过调研国内外引用对象相关研究,梳理引用对象的概念定义、分类体系、应用领域和自动化识别等方面研究进展,总结当前引用对象研究不足并提出未来发展方向。[结果/结论] 引用对象从语义层面评价文献学术研究的贡献和利用价值,为引文分析方法增加了重要维度。引用对象研究需要从理论、技术和应用三个方向进行深化:理论上,加强多维度引用对象特征的研究和分析;技术上,探索基于大规模语料的自动化识别方法;应用上,尝试基于引用对象的科研评价服务。 相似文献
14.
学术文献引文推荐研究进展 总被引:1,自引:0,他引:1
[目的/意义]学术文献引文推荐是指对于给定的学术文献,自动化地为其推荐合适的引文和参考文献。借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的漏引。[方法/过程]分析国内外引文推荐研究的最新进展,阐述引文推荐问题的演化过程,从局部引文推荐和全局引文推荐等方面对引文推荐进行梳理,重点归纳文档相似性、主题模型、翻译模型、协同过滤和混合推荐等5种引文推荐常用方法,并总结引文推荐常用数据集和测评方法。[结果/结论]已有引文推荐研究的主要问题在于未考虑用户偏好的动态变化性及研究领域的综合性,在用户研究和实际应用方面仍有所欠缺;未来引文推荐的研究可运用语义化表达方法和自然语言生成技术,从基于上下文的引文推荐和跨语言引文推荐等方面进行展开。 相似文献
15.
基于引用内容的论文影响力研究——以诺贝尔奖获得者论文为例 总被引:1,自引:0,他引:1
[目的/意义]论文被引频次只能反映论文的宏观影响力,无法揭示论文在他人研究中的具体作用和影响,因此,本文提出从引用内容的主题和功能两方面对论文的影响力进行分析。[方法/过程]以2014年诺贝尔生理学或医学奖获得者J.O'Keefe的高被引论文为实例,首先,采用文献计量学方法对引用内容主题进行分析;对其,影响范围及领域进行可视化分析;其次,从引用性质和功能角度,将引用内容分成正面引用、负面引用和中性引用;最后,将中性引用进一步划分为3类,分别是研究背景介绍、理论基础和实验基础。[结果/结论]结果表明,共词分析可以很好地表达论文影响的主题领域;引用内容的分类可以提供一篇论文被引用的多方面原因。在本实验中没有负面引用,多于10%的引用为正面引用,大约50%的中性引用都是作者在研究背景章节中介绍与施引文献相关的研究工作。 相似文献
16.
17.
中文引文索引主题图的构建及其实现 总被引:1,自引:0,他引:1
18.
19.