首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]高效准确地把握社会诉求转变节点、识别社会诉求主题、追踪主题演化趋势,进而为政府服务和社会治理的和谐有序发展提供支撑已成为一项重要议题。[方法/过程]提出了一套基于语义依赖关系的主题识别和演化路径分析方法。首先,针对同一文档核心词汇,利用全组合方法构建“Source-Target”词对,通过时间区间划分和Word2Vec模型构建动态语义依赖关系网;其次,利用社区发现算法识别每一区间中语义依赖网的子社区,并采用PageRank算法识别出每一子社区的主题标签,通过测量前后相邻时间区间主题相似度来反映主题的演化关系,展示主题生成、分裂、融合、衰亡的演化过程;最后,以甘肃省人民政府公开的省长信箱数据进行模型验证,通过与K-means方法在主题识别效果上进行比较,并利用精确率、召回率和F1值进行方法效果评测。[结果/结论]研究结果发现,本方法应用效果的提升差额曲线均大于0,且三项指标的差额曲线整体都处在0.5分界值之上,取得了明显的优化效果。研究为政府网站领导信箱模块反映的公众关切事项构建了全景视图,该方法也为探索其它社交文本挖掘方法以及支撑国家治理大数据分析实践提供了新的思路。  相似文献   

2.
当前,学科演变更替加速,交叉融合态势加剧,如何快速准确地识别领域的研究主题、理清领域的发展脉络、追踪主题的演化路径及动向,进而把握领域的研究前沿,成为科研工作者亟待解决的关键问题。本文提出了一套基于动态网络的主题演化路径识别方法,首先通过引入分段线性表示法和Word2Vec模型构建动态关键词语义网络,之后利用社区发现算法识别动态网络中的社区,并通过度量相邻时间段间的主题相似性来表现主题间的演化关系,最终识别主题的演化路径。本文以信息科学领域为例开展实证分析,在方法验证部分,本文对比了分段线性表示法与平均时间划分法的分析结果,同时,还将本方法与K-means和LDA两大方法在主题识别中的效果进行了比较。本研究能为科研工作者以及战略决策者开展前瞻性科研活动提供重要的决策支持。  相似文献   

3.
[目的/意义]以全新视角审视挖掘哥伦比亚大学口述历史中心(CCOH)项目特征,深入解构项目主题,为丰富我国口述历史项目主题提供参考基准。[方法/过程]选取哥伦比亚大学口述历史中心9 586个口述历史项目为研究对象,利用Python抓取数据,通过Word2Vec和K-means对筛选后的3 589个项目(过滤无简介项目5 997个)聚类分析并进行项目主题解构。[结果/结论]哥伦比亚大学口述历史中心项目包含4个主题层面:(1)以人物为主题——兼容并包,辐射各行各业群体;(2)以机构为主题——博采众长,发挥自身职能优势;(3)以地区为主题——统筹规划,联动地区体系建设;(4)以特定时期、具体运动/事件为主题——创新范式,观照家国时代主题。  相似文献   

4.
5.
[目的/意义] 基于主题关联相似度揭示主题汇聚及变异过程,识别学科交叉主题及交叉模式,归纳学科主题的演化趋势及演化路径模式。[方法/过程] 获取情报学学科科研论文的高频主题词,构造主题词共词矩阵,利用网络社区演化分析工具生成学科主题演化网络图,结合指标数据对学科主题演化过程进行分析。[结果/结论] 总体上看,情报学学科的研究主题虽然在反复地变化,但核心主题一直存在;扩张、收缩和合并是研究主题最普遍的变化态势,分裂现象较少,产生和消亡现象存在;有3条特定社区演化轨迹清晰地贯穿始终,活跃度相对稳定,反映了3类核心研究主题;3类核心研究主题的演化路径呈现出升华吸纳、共融迭新和辐射推进3种演化模式。研究结果显示,基于主题关联学科主题演化路径的多模式识别方法既能从宏观层面呈现学科主题演化形式,也能从微观层面分析学科主题交叉模式,结合二者可揭示学科主题的继承或创新,预测学科交叉主题的发展方向。  相似文献   

6.
良好的政策环境能够促进我国文旅融合的高质量发展。文章以国内文旅融合中央政策作为数据来源,以五年规划作为划分依据,通过LdaVecNet模型对不同时间窗口下的政策数据进行主题识别,以可视化的方式准确把握我国文旅融合政策不同时间段主题热点以及演化路径,以期为我国文旅融合政策制定与优化等提供参考,为促进文旅融合深度与高质量发展提供有力支撑。  相似文献   

7.
孙佳佳  李雅静 《情报学报》2022,41(2):118-129
对作者关键词进行价值细分研究,有助于识别学科高价值研究热点主题,帮助研究者们精确把握高价值研究主题和学科研究前沿。本文引入营销领域客户价值细分RFM (recency,frequency,monetary)模型,对各个指标进行动态加权,多次实验后,形成多组关键词价值细分结果;从关键词生命周期的角度,结合医学领域的生存分析方法,使用Kaplan-Meier曲线和Logrank检验验证,识别出最优价值细分结果;依据帕累托原则和聚类算法得到高价值热点主题。数据源选择CSSCI (Chinese Social Sciences Citation Index)收录的图情档领域期刊论文,对1998—2019年的题录数据进行实验。相较于已有的热点主题识别方法,本文的识别结果考虑了关键词的价值属性和分类,较好地识别了高价值热点主题。  相似文献   

8.
[目的/意义]突破性创新对科技发展具有关键作用。大数据环境下,科学技术发展本身所具有的复杂、多维、不断进化等特征越发凸显。以动态视角进行突破性创新主题识别,对于为国家、企业及高校详析突破性创新领域、合理配置创新资源以及提供创新升级解决方案具有重要意义。[方法/过程]综合运用主题模型、词嵌入算法以及复杂网络分析等方法构建动态主题网络,全面考量主题在时间窗口内的结构特性以及时间窗口间的演化状态,并以其为基础结合突破性创新的新颖性、突变性、影响力和学科交叉性特征识别突破性创新主题。[结果/结论]面向区块链领域展开实证研究,识别出神经网络(Neural Network)和边缘计算(Edge Computing)两个主题的突破性创新特征最为显著。结合区块链现有研究及美国国家科学技术委员会发布的关键和新兴技术清单,验证了本文方法的可行性和有效性。但有关结果的定量验证,以及融合多源数据的突破性创新主题识别有待进一步研究。  相似文献   

9.
知识经济时代,移动图书馆实现了知识的广泛传播和应用。文章以CNKI数据库中国学者发表的移动图书馆研究文献为研究对象,运用文献计量学和可视化技术方法,对我国移动图书馆研究主题与演化路径进行分析。研究发现:移动图书馆服务模式等是我国移动图书馆研究热点;目前,我国移动图书馆研究正处于高速发展阶段,其创新性较强,值得国内学者持续关注;我国移动图书馆主题演进与移动网络技术环境和用户需求密切相关。  相似文献   

10.
本文在档案学学科主题快速发展变化的背景下,分析一定时间国内档案学的主题结构及演化状况,梳理国内档案学科近20年来的发展脉络。获取1998—2017年间档案学核心期刊的关键词,根据关键词共现关系分时段构建主题网络,展现不同时期档案学的主题结构;根据相似度判断主题之间的演化情况,勾勒出档案学科研究内容的动态变化。根据主题的演化情况得出7条演化路径并归纳出演化的规律;引发学科主题变化的原因有经济、文化、社会科技形态与现代信息技术的影响等;预测未来数字档案、档案文化、档案公共服务、档案信息资源开发利用及整合等仍是学科的研究重点,更加重视面向公众提供档案信息服务和知识服务,与其他学科进一步交叉融合,跨学科范围越来越广泛。研究结果有利于档案学领域学者把握学科的发展脉络,更好地发现新的学科增长点。  相似文献   

11.
利用专利文献数据识别技术领域的技术主题演化发展路径并分析其发展趋势,对于科技界、企业界进行专利技术创新具有重要的意义。首先,使用Open IE 5.1进行SAO (subject-action-object)三元组抽取,基于LDA (latent Dirichlet allocation)模型进行主题识别,根据TRIZ技术创新思想,基于action语义词典将技术主题划分到四个维度;然后,通过计算SAO三元组之间的相似度来测度技术主题之间的语义关联构建技术主题创新演化路径,并利用可视化技术构建技术主题创新演化路径可视化图谱,利用该图谱辅助分析技术主题演化脉络及其发展趋势。最后,通过石墨烯超级电容器(集流体)领域的实证,对该领域的技术问题(problem to problem,P-P)主题、技术功能(solution to solution,S-S)主题、解决方案(problem to solution,P-S)主题和技术效果(solution to problem,S-P)主题的创新演化路径进行解读分析,验证了本研究提出方法的可行性和有效性。  相似文献   

12.
祝娜  王芳 《图书情报工作》2016,60(5):101-109
[目的/意义]科技创新需要快速发现特定科技领域中关键知识衍生与演化的路径,探索未来的知识创新趋势,为此,有必要对知识演化路径进行动态可视化研究。[方法/过程]从主题关联的角度入手,以3D打印领域为例,基于LDA识别出科技创新主题并进行分阶段细化分析,探测主题集群内部与外部的关联强度,识别出主题不同生命周期的演化能力及其演化类型。[结果/结论]实验结果表明,该方法从主题关联的角度入手,构建了基于时间序列的知识演化路径,丰富了知识管理和信息计量的理论研究方法,在实践上则有助于探测科技创新知识。  相似文献   

13.
14.
基于动态LDA主题模型的内容主题挖掘与演化   总被引:1,自引:0,他引:1  
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。  相似文献   

15.
[目的 /意义]科学主题演化路径对认识科学发展过程和预测未来发展趋势具有重要的意义.鉴于现有研究将演化路径上的主题同等看待的缺陷,提出一种新的多位态科学主题识别及其演化路径方法.[方法/过程]以向心度和密度将每个时间区间的主题划分为核心-成熟型、边缘-成熟型、边缘-非成熟型和核心-非成熟型4种类型,并利用余弦相似度将不...  相似文献   

16.
梁爽  刘小平 《图书情报工作》2022,66(13):138-149
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义。[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望。[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融。未来应针对以上问题做出相应改进与深入探究。  相似文献   

17.
宋凯  陈悦 《情报学报》2024,(1):25-33
揭示技术演化脉络是把握技术发展规律的前提,基于专利信息的主题挖掘是基于技术发展微观机制呈现宏观规律的重要研究内容,对技术超前布局和创新驱动实践具有重大意义。技术主题动态演化分析DPL-BMM (Dirichlet process biterm-based mixture model with labelling)是一种附有标签的基于双项狄利克雷过程的混合模型,其突破了传统主题模型在进行主题识别时需固定主题数目的局限,通过增加技术主题表示模块使识别到的技术主题内容更加明确。本文以人工智能领域技术为例进行实证分析,研究结果表明,该方法对技术主题及其演化脉络展示具有实际应用价值。  相似文献   

18.
[目的/意义]探索科研人员职业发展情况及其研究主题的变化规律不仅可以揭示科学生产力发展的内在机制,也有助于对科学事业的发展提供更好的政策指导与支持.[方法/过程]基于自然科学、社会科学、艺术与人文科学的代表性学科数据,对科研人员的职业高峰进行识别.在此基础上以职业高峰作为科研人员学术生涯的划分依据,采用自然语言处理中的...  相似文献   

19.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

20.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号