首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为揭示数字文旅领域关键技术,促进文旅融合及产业高质量发展,文章通过系统挖掘数字文旅技术专利,运用TF-IDF、LDA主题模型、ROST等方法和工具,从专利计量、技术热点、技术主题、技术关联4个方面展开研究并预测其趋势。研究发现:数字文旅技术现处于成熟初期;专利主题可分为交互式人工智能技术、电子导航技术、智能传感技术、3D建模技术、虚拟现实技术5类;发展方向以挖掘5G信息技术潜力、注重以人为本提升游客体验、突破信息壁垒为主。  相似文献   

2.
认为利用专利技术功效主题词与专利引文进行共现分析可直观识别核心专利簇的技术功效特征。与专利引文共现分析相比,专利技术功效主题词与专利引文的交叉共现增加了主题标识,使得基于相同标引主题词的被引专利有相似的技术主题和功效特征。同时,不同的技术功效主题词通过专利引文交叉共现,可以识别不同技术主题的关联度以及技术主题对应的功效特征。最后,选择医用显微内窥镜领域相关专利做实证分析,通过技术功效主题词-专利引文、技术主题词-专利引文以及专利引文共现分析,论证专利技术功效主题词与专利引文共现方法在核心专利挖掘方面的特征、优越性及不足。  相似文献   

3.
黎楠  杜永萍  何明 《情报工程》2015,1(3):090-097
LDA 主题模型可用于识别大规模文档集中潜藏的主题信息,本文提出了一种基于LDA 建立发明人兴趣主题模型的方法,合并每位发明人的专利数据,专利信息基于发明人进行划分,将标准的文档- 主题-词的三层LDA 模型变为专利数据中的发明人- 主题- 词的发明人兴趣模型,实现发明人的主题发现,并利用该模型中主题分布之间的相似性进行发明人的个性化推荐。在采集真实专利数据集上的实验结果表明该方法相比传统的向量空间模型方法和隐马尔科夫模型方法具有更高的准确率,推荐效果更优。  相似文献   

4.
5.
[目的 /意义]技术机会识别是企业技术创新活动得以顺利开展的重要前提,及时发现和把握有价值的技术机会对技术创新突破意义重大。[方法 /过程]从主题挖掘与专利评估的视角提出一种技术机会识别方法,首先应用主题模型识别技术领域涵盖的技术主题并进行专利聚类;其次在技术主题层面展开细粒度分析,综合考虑技术机会应具备前沿性、价值性和时效性的重要特性,采用突变级数法和离群因子算法评估技术主题中的高价值专利和离群专利形成核心专利集,并计算每个技术主题的专利平均年龄;最后,将技术主题中的核心专利占比和专利平均年龄作为核心指标绘制技术机会识别地图,用于识别技术机会。[结果 /结论 ]以智慧农业领域为例,对所提方法进行实证,识别智慧农业领域的5个技术机会,为创新主体的技术研发提供决策支持。但识别结果的定量验证以及融合多源数据进行技术机会识别有待进一步探索。  相似文献   

6.
[目的/意义] 为了解决研究生用户面临的检索问题,提出一种基于LDA和社会网络中心度分析的个性化检索推荐模型。[方法/过程] 首先,该模型以研究生学科专业为个性化特征,并据此选择相应的数据源。其次,该模型使用LDA识别主题内容,以完成全面知识的展示。再次,该模型根据用户提交的检索词在相应的关键词-主题共现网络中进行社会网络中心度分析,以完成用户相关知识的推荐。[结果/结论] 实验表明,该模型能够很好地解决研究生检索中个性化特征、全面知识展示以及相关知识推荐三大问题,其有效性得到一定程度的验证。  相似文献   

7.
解析新兴技术主题的概念,同时结合专利文献的特点,利用专利文献提出识别新兴技术主题的初步技术框架,并以工业生物技术领域的专利文献为数据来源,采用文本聚类技术、共词战略坐标分析、共词网络分析、专利分析等方法对该技术领域的新兴技术主题进行实证分析。  相似文献   

8.
太阳能作为战略性新兴产业受到各国政府的普遍关注.运用专利技术领域共类分析、主题词共现分析和社会网络分析方法,绘制太阳能技术网络的演进并识别不同阶段的关键技术,将对我国太阳能产业技术的发展具有重要的辅助决策作用.对1971~2010年40年间全球太阳能专利数据分析结果显示,随着时间的推移,"太阳能发电系统与LED照明"技术子网络规模越来越大,并出现了新兴的技术子网络;关键技术领域与关键技术主题也越来越多地集中于"太阳能发电系统与LED照明"技术子网络中;在太阳能技术发展的第一阶段,共性技术特征比较明显,随着时间的推移,共性技术特征开始变弱.本研究是在一个比较宏观的层面上进行的,期望下一步做一些更深入的、微观层面的研究.  相似文献   

9.
基于动态LDA主题模型的内容主题挖掘与演化   总被引:1,自引:0,他引:1  
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。  相似文献   

10.
11.
[目的/意义]基于专利数据,探讨识别颠覆性技术主题并揭示主题关联的方法。[方法/过程]以人工智能领域为例,获取目标专利及其引用专利与施引专利,以此计算目标专利的颠覆性指数。基于目标专利摘要,建立以颠覆性指数为协变量的结构主题模型。对领域主题进行分类并构建主题关联网络,同时计算主题流行度,筛选出颠覆性技术主题。[局限]无法完全替代领域专家的经验和智慧,对颠覆性技术主题的预测能力相对有限。[结果/结论]得到人机交互、量子人工智能、机器阅读理解和推荐系统四个潜在颠覆性技术主题,发现当前人工智能领域的颠覆性技术创新聚焦于降低算力成本和优化人机互动两个方向。  相似文献   

12.
基于LDA模型和微博热度的热点挖掘   总被引:3,自引:0,他引:3  
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。  相似文献   

13.
席笑文  郭颖  宋欣娜  王瑾 《情报学报》2021,40(9):974-983
技术相似性是企业、组织或国家进行技术情报分析的重要内容,能为其识别潜在竞争关系和合作伙伴提供准确、有效的信息支持。本文针对传统LDA (latent Dirichlet allocation)主题模型忽略专利文本上下文间语义关联的问题,提出了基于word2vec和LDA主题模型的技术相似性可视化研究方法。首先,基于word2vec模型学习特征词在专利文档集合中的上下文语境信息;其次,基于LDA主题模型构建专利权人-专利-技术主题三层概率分布,并将两者融合生成"词粒度"层面的主题向量、专利文档向量及专利权人向量;再次,利用向量相似性指标计算专利权人间的语义相似度,并在此基础上构建能够直观反映专利权人与技术主题关系的二模网络;最后,以NEDD (nano enabled drug delivery)领域为例进行实证研究,证明了该模型在技术相似性测度分析中具有较好的效果。  相似文献   

14.
[目的/意义] 将论文与专利相结合,建立一套整合基础研究与应用研究的研究前沿识别方法。[方法/过程] 以基于关键词共现的研究前沿识别方法模型为基础,用余弦相似度算法将论文和专利相结合,并使用研究主题年龄和研究主题关注作者数量两个指标来识别研究前沿,最后在LED领域进行应用分析。[结果/结论] 研究表明该方法可以识别出基于单独的论文数据或者专利数据不能识别的研究前沿,同时还可以有效地跟踪研究前沿的产生、成长、消退与消失。  相似文献   

15.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。  相似文献   

16.
[目的/意义] 探索微博舆情传播周期中不同传播者关注的舆情热点和传播内容的主要观点,进而发现舆情传播的特点和规律,为舆情分析与决策提供依据。[方法/过程] 以特定舆情事件的事实文本数据为来源,以生命周期理论和LDA方法为指导,设计研究流程与构建研究模型,对微博舆情事件中不同传播者的话题进行主题研究,其中包括主题抽取和结果语义标注、各阶段的不同传播者主题的语义分析、基于时间维度的舆情主题观点识别与刻画。[结果/结论] 研究发现,论文所提出的研究模型能够挖掘出舆情传播周期中不同传播者的主题结构、观点脉络以及特征,研判出分布在文字当中有关联性的、代表性的、重要的词语。同时,结论中还发现微博中的官媒、大众媒体发布信息中的话题和用户谈论的热点话题具有明显的差异性。  相似文献   

17.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

18.
张培晶  宋蕾 《图书情报工作》2012,56(24):120-126
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。  相似文献   

19.
互联网平台的蓬勃发展产生了以新兴媒体为承载的数字资源,如何从中有效实现知识检索、知识发现成为信息管理领域和互联网技术领域的一个重要课题。本文以《中国分类主题词表》为主题词受控表,首先从词的粒度层面对语料数据进行短文本信息挖掘,其次基于隐含狄利克雷分布(LDA)模型切分文本内容,最后依据词频统计实现主题词的提取、聚类,并通过共现矩阵构建短文本自动分类系统。该系统一方面有效地实现了知识的快速聚类和关联自动分类,另一方面为用户提供了满意度更高的知识发现服务及相关扩展服务。图8。表5。参考文献16。  相似文献   

20.
《新闻界》2021,(9):4-13
数字新闻学正在成为新闻学的主流范畴,研究文献也与日俱增,时至今日,有必要对数字新闻学的整体发展状况和知识脉络进行梳理、总结与反思。本研究以Webof Science核心数据集作为数据来源,借助Python工具训练LDA主题模型,使用困惑度评价指标确定主题数量,并使用主题强度分析研究热点和变化趋势。具体来说,本研究根据主题-词项概率分布,对获得的1325条文献摘要进行主题标识,抽取出了数字新闻学研究在1998-2021年的18个重要研究主题;根据文档-主题概率分布,引入时间维度计算主题强度分布。研究发现,包括数字技术的角色、新闻用户的主动行为、传统新闻理念的变迁、新闻学学科发展等研究主题都保持了相对稳定和上升的趋势,新闻职业身份、新闻学研究方法等少量主题呈下降趋势,但也仅仅是一种弱下降。具体而言,有7个主题的强度呈上升趋势,有5个主题的强度呈弱下降趋势,有6个主题的强度趋于平稳状态。数字新闻学在2021年及未来的研究中正呈现出主题越来越综合化的趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号