首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 531 毫秒
1.
[目的/意义]利用自然语言处理技术,研究一种从科技规划文本内容中自动构建研究前沿主题地图方法。[方法/过程]首先,利用自然语言处理领域中的信息抽取、主题识别等技术对科技规划文本进行主题挖掘分析,然后,利用Java语言开发相应挖掘工具,构建科学研究前沿主题地图,并进行可视化展示。[结果/结论]通过对碳纳米管研究领域的实证研究证明,该方法能够全面、快速准确的绘制出该领域科学研究前沿地图。  相似文献   

2.
[目的/意义]非物质文化遗产资源具有重要的社会价值,将主题图技术应用于非物质文化遗产数字资源的整合中,能够更好地实现非物质文化遗产数字资源的传承与保护。[方法/过程]在分析非物质文化遗产数字资源的主题、关联关系和资源标引的基础上,构建非物质文化遗产数字资源主题图并实现其可视化。[结果/结论]研究结果显示,主题图技术的应用可以为非物质文化遗产数字资源提供基于语义的整合,并将主题之间的关联直观地展示给用户,为用户提供可视化导航。  相似文献   

3.
[目的/意义] 基于AToT模型的多维动态演化分析,不仅可以全面地了解技术主题的动态变化,把握不同时期不同企业的技术布局变化,还可以掌握产业链各环节的技术发展状态,为企业创新提供强有力的决策支持。[方法/过程] 首先提取专利文献摘要中的名词或者名词短语,然后利用AToT模型揭示专利文献中隐含的主题演化及专利权人的技术关注点,最后结合产业链信息把握产业各个环节的发展状况。[结果/结论] 实验结果证明,该方法能够高效地分析专利的内容,揭示企业技术主题的动态演化过程。  相似文献   

4.
[目的/意义] 运用文本分析与可视化等方法绘制基本科学指标数据库(Essential Science Indicators,简称ESI)研究前沿的科学全景图谱,在此基础上绘制全球研究前沿视野下的纳米研究前沿图谱,分析中国在世界纳米前沿的科研表现。[方法/过程] 计算研究前沿间关联关系,利用OpenOrd布局算法可视化科学图谱,并根据图谱中研究前沿的位置关系自动识别研究前沿群。选取含纳米文章超过60%的研究前沿,结合专家判读绘制纳米研究前沿图谱。[结果/结论] 研究表明,科学图谱揭示的科学结构与作者先前的研究成果和业界已有科学图谱的分布较为一致,能有效揭示ESI研究前沿数据隐含的科学结构特征,反映科学前沿分布情况。以世界纳米前沿全貌图为基图,叠加中美在各研究前沿的论文份额,对比分析了中国和美国在世界纳米前沿上优势及发展重心的差异,结合专家研判给出对策建议,助力纳米领域的发展趋势研究,取得了实际应用价值。  相似文献   

5.
[目的/意义]颠覆性技术关乎国家竞争力和国际地位,科学准确地识别出颠覆性技术主题,能够解决技术发展过程中主题不够明确、发展路径不够清晰等问题,以此有效把握技术发展动态,调整国家科技战略布局,更好地抢占国际竞争制高点。[方法/过程]以能源科技领域的专利文本数据为研究客体,构建基于Word2Vec词向量与LDA(Latent Dirichlet Allocation)主题向量的融合特征向量,并引入K-means算法优化主题聚类效果,最后结合颠覆性技术特征指标,识别颠覆性技术主题,利用DTM(Dynamic Topic Model)模型揭示该领域颠覆性技术主题的发展状况。[结果/结论]通过人工验证和模型结果对比可以发现,实证结果具有合理性,且模型的精准率、召回率、F1值均高于同类型的主题模型,证明该方法对颠覆性技术主题识别具有较好效果。  相似文献   

6.
[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。  相似文献   

7.
[目的/意义] 将高校图书馆日常工作和服务中产生的服务数据进行整合、分析,并以信息图的形式进行可视化表达,让用户能更清晰、容易理解服务数据及数据背后的意义。[方法/过程] 在确定信息图的受众后,从多种途径对数据进行采集,经过数据的清洗、整合、分析,提取要表达的主题,并采用合适的表现方式进行信息图的绘制。[结果/结论] 实践表明,合理的可视化表达有助于更清楚了解图书馆各类资源的利用情况,明确读者对图书馆各类服务的需求,预测图书馆未来工作的开展方向,为图书馆的各项工作提供决策依据。  相似文献   

8.
[目的/意义]社交网络快速发展的时代,越来越需要自动摘要技术来解决产品评论信息过载。针对现有图模型方法在评论摘要抽取中存在信息不充分、准确性差的问题,提出一种融合主题聚类和语义图模型的多文本摘要方法。[方法/过程]首先运用FCM(Fuzzy C-means)聚类算法对评论文本进行主题划分;然后利用Word2vec模型获取分类评论句子的向量化表达,并根据句子间的语义相似度进行图模型构建;最后利用加权图排序算法,自动抽取出重要性高的句子形成文本摘要。[结果/结论]实验结果显示,该方法能有效识别出产品评论的关键内容,与传统方法相比,融合主题聚类和语义图模型的方法在信息覆盖率和信息多样性指标方面得到了更高的分数,提高了摘要抽取的质量和效率。  相似文献   

9.
[目的/意义] 提出一种融合评论主题识别与技术属性多维度分析的技术机会发现方法,从技术需求驱动视角识别技术机会,为企业前瞻布局研发方向与进行科研管理规划提供决策建议支持。[方法/过程] 以产品在线评论为研究数据源,首先,利用LDA主题模型识别出评论技术主题,提出技术评论主题强度和主题新颖度两个指标,筛选出新兴重点技术评论主题。然后,从学术论文、技术专利中人工选取技术属性词,通过TF-IDF值计算得到评论高频词,结合专家知识进一步筛选出技术特征词,构建产品技术属性词-技术特征词表。通过相关性计算分别得到与评论相关和与新兴重点技术评论主题相关的技术属性。最后,提出一种产品重要技术属性识别指标模型并设计一种多维度分析方法,分析产品重要技术属性的特征情况,最终识别出蕴含在评论文本中的新兴技术机会。[结果/结论] 实验结果表明该方法能够有效地识别技术机会,为企业产品技术研发管理提供参考。  相似文献   

10.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

11.
专利地图是新形势下为提高政府科研管理质量,解决公共信息失灵,探索技术发展态势的一种有效方法,可以为政府科研管理工作提供有力的决策支持.文章在对共现分析和专利地图相关文献回顾的基础上,针对当前研究存在的主要问题,采用共现分析的方法,从数据关联模型、共现连接强度、线性相关系数三个层面,构建了一个三阶段的共现分析模型,并通过可视化技术将专利信息绘制成专利地图,以图谱的形式展现分析的结果.在此基础上,以公路工程领域为例,进行可视化实验,以此判别该领域的深层次结构,为专利地图在政府科研管理中的应用提供一种思路和手段.  相似文献   

12.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

13.
任海英  李真 《图书情报工作》2021,65(19):117-129
[目的/意义] 基于专利文献识别产业技术领域的核心技术链,对于梳理产业核心技术架构,分析我国核心产业链的薄弱环节,确定技术攻关方向,完善技术链和产业链具有积极意义。[方法/过程] 改进经典的SAO结构,提出基于输入输出型SAO网络的核心技术链识别方法。从领域专利文本中提取输入输出型SAO结构作为技术要素,根据技术要素间的输入输出关系构建技术的领域知识网络;运用加权k-Core方法获得包含主要技术关系的核心知识子网络,并通过识别强连通分量实现核心知识子网络的分解;利用主路径分析等方法识别核心知识子网络中的外部核心技术链与内部核心技术链,并参照其涉及专利对核心技术链进行解读。[结果/结论] 将所提出方法应用于量子计算领域,识别出其中蕴含的外部和内部核心技术链,通过专家验证以及与相关学者研究的对比,验证了结果的准确性。该识别方法具有技术链关系连贯、自动化程度高以及灵活性强等优点。  相似文献   

14.
宁子晨  魏来 《图书情报工作》2020,64(12):106-117
[目的/意义] 专利文献与学术论文分别表现了技术创新与科学研究的新进展,通过专利主体将二者结合进行技术主题演化分析,对进一步发现专利技术与科学研究间的关系有一定的参考意义。[方法/过程] 以数据挖掘领域的学术型发明人为纽带,从专利主体-关键词耦合、IPC耦合以及IPC-关键词共现3个角度,提出关联方法并构建研究框架,分析不同时间段下主体、技术及主题多维关联关系的演化,探究数据挖掘领域内专利文献与学术论文的主体、主题关联关系。[结果/结论] 学术型发明人在数据挖掘技术创新中的作用越来越重要,大多主体的技术主题是相近的,部分甚至呈现高度的统一,但是也存在少数技术与主题不直接相关,差异度较大,但不论技术与主题是否直接相关,数据挖掘相关技术发明与科学研究都已经实现了较为深入的相互渗透。  相似文献   

15.
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。  相似文献   

16.
[目的/意义] 创新是学术论文的本质要求,如何有效评价学术论文的创新力一直以来备受国内外专家和学者关注。随着信息技术的发展,利用计算机技术从论文内容角度对单篇学术论文的创新力进行评价逐步成为可能。[方法/过程] 提出一种基于研究主题对比的单篇学术论文创新力评价方法。该方法首先利用Keygraph算法提取代表论文研究主题的关键词,然后,将论文的研究主题与科学研究前沿主题进行相似度计算,最后,结合期刊影响因子和Altmetrics两项外在指标提出一种论文创新力综合评价模型。[结果/结论] 通过对"碳纳米管"材料研究领域的实证研究证明,该方法能够有效、迅速和准确地从论文内容角度对单篇学术论文的创新力进行评价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号