首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
柴文越  刘小平  梁爽 《现代情报》2023,(12):164-177
[目的/意义]梳理国内外新兴主题识别相关研究,总结不同方法的优缺点,归纳现有研究存在的问题,为新兴主题识别研究提供参考。[方法/过程]首先对新兴主题及其相关概念进行辨析;其次根据新兴主题识别的流程,从数据源及分析对象的选择、识别主题的方法、用于筛选新兴主题的特性与指标3个层面对相关文献集进行梳理与分析;最后,提出现有研究的局限与不足,并对未来发展作出展望。[结果/结论]新兴主题识别研究经过20余年的发展,已经形成了较为规范的研究流程及较为丰富的研究方法,但仍存在一定的不足。在理论层面,新兴主题的定义尚不明确;在数据集构建方面,数据源的选择与融合方式有待完善;在主题识别方面,研究方法时滞性较强,对语义关注和解释不足;在筛选指标方面,缺乏客观完整的评价体系。未来需要针对相关理论和研究方法进行更为深入的研究。  相似文献   

2.
3.
针对目前文献管理软件无法识别用户潜在研究兴趣从而进行个性化推荐的现状,文章提出了基于主题的社会化推荐方法。首先通过基于内容的个性化过滤方法识别用户的主题偏好,然后利用社会网络分析方法 (SNA)识别学术网络中有影响力的文献,进而产生推荐。最后提出了基于社会网络的科技文献个性化推荐的框架。理论分析证明该方法可以准确反映用户的研究兴趣,灵活地识别用户所属的学术网络,从而为目标用户产生精准的文献推荐服务。  相似文献   

4.
发现和追踪领域新兴主题是研究人员发现和追踪本领域内最新研究趋势和研究方向的一个重要途径。新兴主题探测可以探测、识别、发现这些新兴趋势和新兴主题。本文对ISI Web of Science数据库中收录的关于新兴主题研究的文献进行收集,然后从文献计量学的角度进行定量分析;利用CiteSpaceII对国家、机构、作者的合作关系做出对应的知识图谱;并对共被引文献的关键节点文献进行了研读和分析;最后利用CiteSpaceII生成的本研究领域中的研究主题聚类图、时序图对研究内容及现状进行了分析和预测。  相似文献   

5.
6.
钟辉新 《现代情报》2017,37(12):162-167
介绍了新兴趋势等基本概念,在国际国内文献调研和分析的基础上,揭示了基于文献计量学、文本挖掘结合计量学、复杂网络理论在新兴趋势探测研究中的进展,最后总结了新兴趋势研究走向与存在问题。  相似文献   

7.
[目的/意义]科学准确识别关键共性技术对企业和国家来说都是至关重要的战略议题。[方法/过程]文章提出了一种基于专利文献分析的关键共性技术识别框架,运用文本挖掘和技术演化分析方法,获取特定领域的关键共性技术。首先,使用Viterbi算法识别专利文献中的专业术语,通过LDA算法捕捉专利文献中的技术主题聚类;其次,通过将技术主题的共类特征数值化,作为共性程度的度量;随后,将技术主题节点在技术演化转移网络中的关键程度作为技术关键性的表征,并使用PageRank算法衡量技术主题的关键性。最后,以机器人及数控机床技术为例,验证了该方法的可行性和有效性。[结果/结论]该方法可实现高效、准确的关键共性技术识别,为国家制定创新扶持政策提供支撑。[局限]研究仍需扩大科技文献的收集范围,以实现更全面的关键共性技术识别。  相似文献   

8.
新兴研究主题识别可为研究者提供选题方向,把握技术未来前景。传统基于关键词的主题识别,不能准确反映主题词之间的逻辑关系,因而对研究主题的揭示需要依据专家的判断。本文提出的基于突现文献和SAO相似度的新兴研究主题识别,在确定了具有新兴特征的文献后,通过对文献摘要的语义关联分析,揭示了文献研究内容的相似性,从而更准确地提炼出研究主题。文章最后以精密单点定位技术为例对所提出方法进行了实证分析。  相似文献   

9.
政策文本内容深度挖掘有助于梳理政策演变轨迹并客观剖析政策与实践存在的脱节问题。基于学术界对科技创新政策整体性、系统性把握不足,采用文本挖掘技术对我国1996—2017年国家科技创新政策典型文本数据进行分析。通过Rwordseg技术提取关键词、构建关系矩阵。据此,采用K-means聚类将国家科技创新政策按内容和性质进行主题分析。其中,内容聚类结果包含八类政策主题,性质聚类结果包含三类政策主题。进一步地,采用多层多维交叉视角分析国家科技创新政策演化过程,结合科技创新实践报告,对政策文本的有效性进一步分析。研究发现不同内容、性质和效力政策在科技创新发展的各阶段表现出差异性和失配特征,据此凝练出政策演化规律,并提出了政策完善的针对性建议。研究结果能够对科技创新政策体系的理论完善形成有益补充,同时为国家科技创新实践提供现实指导。  相似文献   

10.
如何捕捉科技领域发展趋势并高效准确地追踪科研活动动态演变一直是研究人员关注的焦点。以美国国家科学基金会政府资助项目文本为分析数据源,综合运用主题模型及指标构建方法,探索文本结构特征并从资助金额、布局强度等多个维度分析,分析主题生命周期提出基于FSD模型的项目文本新兴主题探测方法。结果表明,该方法能够快速前瞻识别出新兴主题,形成主题—主题词—项目序列号的混合分布聚态集群,从新兴主题探测数量、探测质量及探测时间3个维度对比验证了新兴探测模型的优越性。  相似文献   

11.
从浩瀚的科学文献中准确地探测出新兴趋势是科研人员及其管理者把握前沿和科技创新的关键任务之一,也是制定科技发展战略时面临的一大问题。文章在对新兴趋势探测过程及关键技术进行解析的基础上,分析了目前基于文献的新兴趋势探测方法存在的主要问题。针对存在的问题,提出形成以新兴趋势概念为基础的丰富的主题表示框架、从概念语义出发的主题特征的识别与抽取、主题确认与趋势判断的量化评价的对策。  相似文献   

12.
科技文献是科学研究的基础,展示文献中主题的演化过程有助于科研人员把握研究的脉络。针对某领域的科技文献,以构建时序主题链的方式来展现主题随时间变化的事实。为此,提出了主题间转移概率的计算方法和时序主题链的构建方法。实证研究选定国内管理科学领域三个核心期刊在2000-2011年间发表的4244篇论文进行实验,结果表明,时序主题链可以有效地展示主题随时间变化的过程,并能揭示主题演化过程中不同主题间的隐含关系。此外,通过分析时序主题链中的结构特征,还可揭示不同主题间的交叉融合特性。  相似文献   

13.
基于文献多属性测度的新兴主题识别方法研究   总被引:1,自引:0,他引:1  
对新兴主题的识别有助于科研人员把握相关领域的研究方向。针对目前新兴主题识别以关键词词频判断为主的局限性,构建文献多属性测度模型,利用高关注度、高成长潜力度以及高关联度指标对关键词进行有效识别并筛选,最终确定新兴主题。并以精密单点定位技术为例,说明此方法的实施步骤以及可行性。研究结果表明,根据多属性测度得到的精密单点定位的新兴主题更加明确,指示性强,与该领域现实研究状况(实时精密定点定位、定位误差修正以及模糊度固定等方面)具有较高的吻合度。  相似文献   

14.
程豪 《今日科苑》2021,(2):76-87
在互联网背景下,文献数据爆炸式增长的态势向人们有效获取信息和知识的路径发出挑战.本文以"科技统计"文献数据为研究对象,探讨该类数据预处理、统计描述、关键词挖掘的流程和方法,并进一步应用LDA主题模型,从理论和应用角度为"科技统计"文献数据挖掘提供研究思路和方法支持.  相似文献   

15.
[目的/意义]预测社科领域在未来有发展潜力的研究主题对于科研工作者寻找新的学科增长点和政府部门优化资源配置至关重要。文章提出一种基于语义表示和动态主题模型的社科领域新兴主题预测框架,以期丰富和完善主题预测研究的方法体系。[方法/过程]首先,使用BERT模型和UMAP算法对文本进行语义表示和向量降维,再通过动态主题模型对嵌入向量进行聚类,从而获得全局主题;其次,构建新兴主题指标计算公式,基于Neural Prophet模型和非参数检验方法预测新兴主题;最后,通过划分时间窗将全局主题细化为多个局部主题,以定位最近时间段的新兴词汇。[结果/结论]选取“人口老龄化”领域的学术论文和报纸进行实证研究,并采用资料验证法进行方法有效性分析,结果表明该方法能够快速准确地预测社科领域中的新兴主题。  相似文献   

16.
[目的/意义]科技创新是驱动高质量发展的核心动力,科技新闻是人们了解科技发展情况的重要途径,识别科技新闻中的热点主题,反映国家战略发布和实施过程中的状态及变化,以为政府及科研人员提供有效的决策参考与信息支持。[方法/过程]从国家科技部网站中采集2011—2021年发布的科技新闻,借助新词发现与LDA主题模型等文本挖掘方法,文章构建了科技新闻热词发现与主题识别的研究方案,并对新闻热点进行演化分析。[结果/结论]我国科技新闻报道中主要集中于高新技术、科技交流合作、人才培养与激励、农村科技发展、绿色生态、科技创新载体建设和政府部门工作7个主题范畴;高质量发展总纲提出前后的关注热点产生了一定程度上的变化;科技创新驱动高质量发展相关新闻事件中,政府工作与高新技术的发展是关注的重点。  相似文献   

17.
【目的/意义】颠覆性技术具有隐蔽性和突变性,而技术主题在演化过程中会释放颠覆性趋势产生的早期信号,本文提出一种基于专利主题演化的颠覆性技术识别方法。【方法/过程】首先,基于S曲线法判断技术生命周期;其次,综合运用文本挖掘和社会网络分析方法识别技术主题的演化事件;最后,定义新主题出现、原主题趋热和多主题融合三类突变情况,用于识别具有颠覆性潜力的技术主题。【结果/结论】通过类脑智能领域专利实证,发现六个新出现主题、四个趋热型主题和六个融合型主题,通过专家判读,证明了所提方法的有效性,同时筛选出五项主题作为最终预测结果。【创新/局限】本文基于动态社区发现算法对技术主题的演化特征进行分析,进而基于主题突变性筛选颠覆性技术,但数据来源较为单一,将在未来研究中加以扩充。  相似文献   

18.
19.
20.
[目的/意义]从学术共同体的评论性引用视角出发,以引文全文本为基础,结合词频统计、深度学习等方法,探析引文文本中表征突破性评价的文本特征并构建自动识别模型以实现从海量文献中识别潜在突破性文献。[方法/过程]以诺贝尔生理学或医学奖获得者的关键文献以及Science十大科学突破主题的代表文献(医学领域)作为金标准突破性文献集并获取引用语句,对引用语句进行词频统计并结合人工筛选获取表征突破性评价的常用词。对引用语句进行人工标注,利用BERT、BIOBERT模型进行训练形成自动识别模型,并选择癌症领域进行实证分析。[结果/结论]结果表明,学术共同体在评价具有重大突破价值的文献时具有明显的文本特征;相较BERT模型,生物医学语言表示模型BIOBERT对突破性评价引用语句的识别能力明显增强,F1值为0.84。基于引用语句的自动识别模型能够较为精准地识别具有重要学术价值的文献并能在一定程度上实现早期识别和早期评价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号