首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
共词分析法研究(三)——共词聚类分析法的原理与特点   总被引:17,自引:3,他引:17  
共词聚类分析法采用聚类的计算方法,对文章中共观的词对(主题词或关键词)的关联性进行运算,将关系密切的词聚集归类,从而达到挖掘隐舍信息的目的.通过对聚类原理的分析,认为该方法具有客观性、科学性、敏感性的特点.并讨论了共词聚类分析法的不足以及其解决办法,最后介绍了共词聚类分析法的最新研究进展.  相似文献   

2.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

3.
基于词共现的概念图自动构建研究   总被引:1,自引:0,他引:1  
提出了一种利用词共现技术自动构建概念图的方法,首先进行词条选择,并计算词条之间的关联强度生成关系矩阵;接着,从关系矩阵中挖掘概念图;最后,利用可视化技术动态展示概念图。实验表明,新的挖掘算法和可视化技术的引入,能够改善概念图自动构建的效果。  相似文献   

4.
以我国图书馆学7种核心期刊2005~2009年刊载论文为样本,利用共词分析方法,借助spss11.5软件,对论文中出现的关键词进行统计,对高频关键词进行系统聚类分析,以探索近年来我国图书馆学的研究热点。  相似文献   

5.
文章以国际权威引文数据库Web of Science为数据来源,收集了到2011年为止有关社会计算的研究文献,并对其进行了共词分析。通过关键词词频统计分析,建立高频词共词表,利用SPSS进行层次聚类,归纳出社会计算领域的8个热点研究主题,并对其中5个热点研究主题进行深入分析与探讨,以期为该领域今后的研究提供一定的参考。  相似文献   

6.
鉴于近年突发事件在微博传播的巨大影响力,提出基于爆发词识别的微博突发事件监测方法。把微博突发事件监测分为微博预处理、爆发词抽取、爆发词聚类三个模块。先提出微博噪声数据过滤规则从海量数据中过滤噪声微博,然后采用相对词频、词频增长率、爆发词权重三个计算指标来提取出爆发词特征,最后采用共词分析方法来实现爆发词聚类,从而提取突发事件。最后以新浪微博数据为例进行实验,验证了提出的算法对突发事件监测能取得不错的效果。  相似文献   

7.
共词聚类分析法通过聚类的方式对学科主题词进行归类划分,从而实现对学科结构的分析研究.没有聚集中心的聚类,使得类团划分方式与学科研究点主题词分布模式存在一定的差别,并对类团分析产生较大负面影响.为类团指定核心词,并把核心词放置于共词矩阵中进行分析,有助于对类团概念的正确定义以及类团之间的关系分析,其至修正聚类算法中存在的一些问题.笔者的创新点在于通过指定类团核心词,解决没有聚集中心的聚类过程所存在的问题.  相似文献   

8.
[目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。  相似文献   

9.
共词分析法用于文献隐性关联知识发现研究   总被引:2,自引:1,他引:1  
因研究者知识面的局限和人为的去除、隐藏、弱化等行为,某些领域科技文献中经常出现某些有价值关联被忽略的现象.本文提出了基于共词分析的隐性关联知识发现方法,用于发现这些尚未被发现的联系或复现这些被主观隐藏的特定联系,揭示出技术发展动向,以提高情报研究质量和情报工作地位.  相似文献   

10.
在互联网普及的今天,人们获得信息的途径以及数量是前所未有的.面对如此庞大的信息,如何选择变得至关重要.故此,网络话题发现技术应运而生.通过该技术,将海量的网络信息按照具体的话题进行归类,既方便了人们获取信息,又大大提高了准确性.  相似文献   

11.
为探索国内信息构建研究的现状与热点,本文采用共词分析方法,并利用多元统计方法中的因子分析法和系统聚类法研究各主题词的关系。研究结果显示国内信息构建研究主要集中在知识管理、图书馆信息服务、图书情报学、数字图书馆评价、信息导航、政府网站信息服务等6个领域,是当前信息构建研究的热点领域,但总体来说国内信息构建研究主题较为分散,文献较少。  相似文献   

12.
共现分析在专利地图中的应用研究   总被引:4,自引:0,他引:4  
高利丹  肖国华  张娴  房俊民 《现代情报》2009,29(7):36-39,43
本文对专利情报研究中的共现分析方法作了分类,将其分为共引、共词与共类分析3种。并结合专利地图分析探讨了3种分析方法的主要功能、作用及结果表现形式,通过制作专利地图,对3种共现分析所产生的结果作了解释,并对这3种共现分析方法的优缺点作了评述。  相似文献   

13.
一种基于词上下文向量的文本自动分类方法   总被引:1,自引:0,他引:1  
分析了传统文本自动分类方法的不足、词上下文向量的含义及其在自动分类中的作用,提出了一种基于词上下文向量的文本自动分类方法,该方法利用词上下文向量来生成分类器的类别中心向量和待分类文本的文本向量,使分类质量有所提高。  相似文献   

14.
将文本挖掘和共词分析方法相结合应用到专利文献的研究中去,以期通过对专利的内容分析更深层次地了解不同技术主题的研究现状及发展趋势.以射频识别(Radio Frequency Identification,RFID)技术领域为研究对象,对此领域专利的摘要进行文本挖掘,从中提取能够反映此技术领域特征的关键词,根据关键词之间的共现关系,对其进行聚类分析,得到目前RFID领域的六个技术主题,并借助战略坐标图对这六个技术主题进行分析,探寻每个技术主题的发展趋势,为企业技术创新活动和产业发展战略的制定提供决策参考.  相似文献   

15.
基于共词分析的文本主题词聚类与主题发现   总被引:3,自引:0,他引:3  
文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。  相似文献   

16.
17.
[目的/意义]对国内文本情感分析的研究成果进行梳理与计量分析,有助于从不同角度了解主题研究状况、发文情况,对后续的研究具有一定的参考价值。[方法/过程]本文对发文期刊、作者团队进行统计分析,并利用共词分析法,研究关键词之间的联系,探讨近十年来在文本情感分析的研究热点及现状。[结果/结论]结果表明,我国近两年对文本情感分析的研究主要有基于情感词典的机器学习和神经网络的深度学习两种方法,文章最后指出了两种方法的研究现状及未来研究方向。  相似文献   

18.
基于关键词共现频率的热点分析方法研究   总被引:2,自引:0,他引:2  
关键词共现可以有效地反映学科领域的研究热点,为科学研究提供辅助支持。文章系统梳理基于共现频率的共词分析相关度算法、聚类算法、可视化方法等,评价现有聚类算法,并针对k-means聚类算法提出改进构想。  相似文献   

19.
我国数字信息资源研究的热点领域:共词分析透视   总被引:10,自引:0,他引:10  
本文利用SPSS软件,对CNKI数据库中近10年以来数字信息资源领域发表的期刊论文进行共词分析,并借助多元统计学方法中的因子分析法和系统聚类法,研究各主题词间的关系,探讨了国内数字信息资源的研究现状与热点。  相似文献   

20.
基于文献计量的共词分析研究进展   总被引:2,自引:0,他引:2  
廖胜姣  肖仙桃 《情报科学》2008,26(6):855-859
采用文献计量方法分析了国内外共词分析论文的研究特点。首先,基于Web of Science分析了国外共词分析研究论文的分布特点,得出了国外共词分析研究方向的高生产力的作者、国家、机构、期刊等,并分析了被引频次最高的几篇论文的特点;其次,基于重庆维普有限公司研制的《中文科技期刊数据库》(1989—2007)分析了国内共词分析文献的作者合作情况、期刊分布等。这将有利于我们掌握国内外共词研究法的核心作者、重心研究区域等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号