共查询到18条相似文献,搜索用时 528 毫秒
1.
2.
3.
基于科技文献中词语的科技发展监测方法研究 总被引:3,自引:2,他引:3
词是科技文献的基本内容单元。因此通过词来对科技文献进行研究分析,可揭示科技的发展动态。目前这些方法主要包括:词频分析方法、基于词网络关系的共词分析,Kleinberg突发词监测方法、短语差异分析方法。 相似文献
4.
本文充分考虑了主题词之间的已知关联和未知关联,利用MeSH词表对已知关联进行了处理,优化了主题结构分析方法,并以属分关系为例,对该方法进行了实证分析.结果表明在阈值一定的前提下,基于MeSH的主题结构分析方法能够有效地剔除词间的已知关联,揭示出相对较微弱的词间未知关联,起到了主题词关系过滤的作用,为知识发现奠定了基础. 相似文献
5.
共词聚类分析方法是科技情报分析的一种重要的方法和技术,已逐渐发展成为科技情报分析中最活跃的研究领域之一。共词聚类分析方法可以形成一系列由科技文献组成的文献聚类,这些聚类所包含的主题特征对于揭示学科领域知识发展变化具有很好的指示作用。本文分析了基于词频统计共词分析的主题识别方法及其局限,提出基于概率模型的主题识别方法。实验表明,该方法可以充分地利用概率模型的优点,改进了传统共词分析方法的不足,从而可以更好地应用于主题分析中的主题识别环节。 相似文献
6.
情报检索是情报研究工作的前提和核心。本文基于科学知识图谱理论,对近数十年来情报检索的研究做概貌性描述,运用主题词词频分析、聚类分析、共词分析、合著分析等文献计量方法,统计了情报检索领域1956-2015年的103 733篇学术文献,对文献的时间分布、文献主题分布、关键词词频、国家分布、机构分布、作者分布、合著关系等数据进行分析,并通过可视化知识图谱展示了作者合著关系以及主题词和关键词的共现关系。结果表明,情报检索的相关研究正处于快速发展阶段,研究主题明确、地域差距显著,已经形成了一批具有核心影响力的专家学者。本文通过分析情报检索领域的发展脉络,对于情报学领域的学者进一步寻找研究热点、挖掘新的研究问题具有一定的参考意义。 相似文献
7.
8.
基于Web of Science/Medline数据库,采用词频标准化和线性回归的方法分析全球健康领域的热点主题与趋势,采用共词法对主题词关联度进行量化,采用网络关系图分析主题词之间的关系并识别热点领域,以期从文献计量学角度为全球健康领域的发展和实践提供参考。 相似文献
9.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分,
为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇
章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者
用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度
矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层
次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】
本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标
签确定的方法比较简单,可以进一步探究。 相似文献
10.
针对专利技术主题识别方法存在缺少语义语境、可解释性弱和主题界定模糊等问题,提出了一种融合专利结构数据和文本语义的技术主题识别分析方法一并解决上述问题,有助于领域人员把握技术研究内容,为研发决策提供科学支持。方法以专利IPC作为结构数据改进纯文本主题建模获取由IPC和专家分类意见指导的主题词向量,同时使用word2vec获取语义词向量,将结果进行向量拼接,进而获得易于解释的精准技术主题,满足细粒度分析要求。最后,以非小细胞肺癌治疗领域作为实证研究,证实了该方法的科学性和实用性。 相似文献
11.
首先对共词分析法中存在的问题进行了分析,指出解决共词分词法中存在问题的关键在于将专家知识集成到共词分词法中;为实现共词分词过程中专家知识的集成,提出一种基于语义的共词分析法,该方法利用主题图来描述专家知识,以该主题图为指导进行共词分析,能有效克服共词分词中存在的问题;最后,本文以人际情报网络这一研究领域作为实现对象,验证了该方法的科学性和可行性。 相似文献
12.
本文利用CNKI数据库通过词频分析法结合共词分析法对2005-2016年我国"科学数据"领域的研究主题进行演化分析。选取2005-2016年"科学数据"领域发表于北大中文核心期刊和CSSCI来源期刊的547篇期刊论文作为数据来源,通过对数似然值结合相对变化率判断关键词词频的相对增长、平稳和下降趋势,识别不同研究时段"科学数据"领域的核心词、突变词和新生词,并结合共词分析法揭示"科学数据"领域相关文献研究主题的动态演化趋势。研究结果表明:2005-2016年我国"科学数据"领域的相关研究从以技术层面的研究主题为主逐渐过渡到管理层面、服务层面和政策层面的研究主题,图书情报领域已逐渐成为我国"科学数据"相关研究的主要学科领域。 相似文献
13.
共词分析中作者关键词规范化研究——以图书馆个性化信息服务研究为例 总被引:1,自引:0,他引:1
介绍了共词分析法及其一般分析流程,指出目前共词分析中所用作者关键词存在不规范的现象,给出了对作者关键词进行规范化处理的思想方法及规范化处理应遵循的原则。并以图书馆个性化信息服务为研究主题,利用SPSS17.0软件,对规范化处理前后的关键词分别进行了聚类,对比聚类结果,说明对作者关键词进行规范化处理是共词分析的一个必要而有效的过程。 相似文献
14.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。 相似文献
15.
[目的/意义]研究的目的在于揭示社会化问答网站用户糖尿病相关信息需求,以及随时间的推移这些信息需求的演变。[方法/过程]以中文社会化问答网站糖尿病相关提问文本为基础,构造共词网络,运用词频分析、社会网络分析和社区发现的方法,确定网络社区演变路径,以可视化的形式呈现信息需求的特征及演变。[结果/结论]10年间用户表达出来的信息需求趋于集中,用户对健康管理的信息需求有较大增长,但这部分仍未成为核心关注点。建议用户更多地对健康管理给予关注,公共卫生部门加强糖尿病预防内容的科普,并对相关并发症加强防控和管理。 相似文献
16.
国内图书馆PIS研究计量分析及其发展路线图——基于战略坐标图的共词分析 总被引:1,自引:0,他引:1
以CSSCI中信息科学领域16种核心期刊2000--2005年、2006--2011年两个时间段的个性化信息服务(Personalized Information Service,PIS)相关论文的全部关键词为研究样本,对两个6年阶段的图书馆PIS研究论文分别进行了共词聚类分析,绘制了其战略坐标图。通过对比分析两个6年阶段的战略坐标图,标绘出图书馆PIS研究的路线图。该路线图全面、直观地揭示了PIS研究主题的发展脉络及演化趋势。 相似文献
17.
[目的/意义]分析2007-2016年中国竞争情报年会会议论文的基本情况,揭示竞争情报研究热点主题及其演化规律,探索竞争情报的未来发展趋势。[方法/过程]选取2007-2016年中国竞争情报年会会议论文,对高频关键词综合运用共词分析、聚类分析和战略坐标图方法进行分析。[结果/结论]展示我国竞争情报研究的主题演化特征,表明竞争情报系统是领域研究的基础主题和活跃主题,大数据和智库研究将会是我国竞争情报发展新的挑战,以情报池为基础的综合情报分析将会是未来竞争情报研究的趋势。 相似文献