首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义]作者相似度研究是探测学科知识结构、挖掘潜在合作关系的重要基础.[方法/过程]本文拟构建作者的关键词—文献2模矩阵,通过研究矩阵对应的灰度图像之间的相似性来判定作者相似性,并利用灰色关联理论计算基于合著关系和基于关键词的作者相似度,最后进行实证分析,对比三种作者相似性结果.[结果/结论]实验表明:基于关键词...  相似文献   

2.
XML信息检索中结构相似度计算   总被引:2,自引:0,他引:2  
鲁远  万常选 《情报杂志》2007,26(11):109-111
XML信息检索中,检索结果排序时必须同时考虑关键词相似度和结构相似度,就此重点讨论了结构相似度计算问题,提出了一种计算用户查询和检索结果间结构相似度的数学模型。  相似文献   

3.
梁少星 《现代情报》2015,35(8):151-156
相似度计算方法的优劣直接影响到信息检索与推荐的效果。本文根据本体图模型中属性序列的特点,综合考虑层次关系和属性关系,在分析路径关联相似度、层次相交关联相似度及属性相交关联相似度的影响因素的基础上给出了实例之间综合语义相似度的计算方法。文章最后讨论了该相似度计算方法在解决基于内容的推荐中的过于专门化问题、协同过滤推荐中的稀疏性问题以及检索中查全率和查准率问题中的应用。  相似文献   

4.
随着信息技术的飞速发展,自然语言处理越来越受到人们的重视,句子相似度计算在自然语言处理领域具有非常重要的地位。基于二元文法模型的汉语句子相似度计算方法以相邻关键词共同出现进行加权的方式计算句子相似度。方法重点考虑关键词词形和句长相似度,还适当考虑了近义词的情况。实验结果表明,该方法可以更好的处理句子长度差较大的句子相似度,在计算汉语句子相似度时准确率高于关系向量模型的方法。  相似文献   

5.
文章提出了科技论文关键词的战略图分析方法,从论文作者关键词、机器标引关键词和标题摘要中抽取的关键词中选择关键词,以消除标引效应,通过聚类将关键词划分为研究主题簇,计算研究主题簇的向心度指标和密度指标,绘制战略图,将研究主题簇分为4类,据此分析问题领域现状;将数据分为若干阶段,分别形成战略图,通过计算相邻阶段的主题簇的相似度指标、起源指标和影响指标,了解研究主题变迁和相互关系。实验证明了战略图分析方法的有效性。  相似文献   

6.
本文提出了一种基于WordNet的概念格间语义相似度计算方法,该方法利用WordNet中各词汇之间的结构关系,参考其各词汇间的距离、密度、深度来计算各概念间的语义相似度来反映概念间的语义关系,然后根据概念与其他的概念格中的语义相似度来计算两个概念格间的语义相似度,为以后的研究做准备。但是这种方法尚不完善,需进一步进行扩展与改进。  相似文献   

7.
一种基于关键词加权的共词分析方法   总被引:1,自引:0,他引:1  
基于关键词的共词分析是文献计量中常见的一种研究方法,该方法是利用论文关键词在文献数据库中成对出现的统计学特征来分析关键词之间的亲疏关系,从而揭示这些关键词所代表的主题之间的关联结构。本文分析了传统的关键词共词分析法中存在的忽视关键词之间的重要性问题,探讨了其中基于关键词加权的合理性和必要性。本文还提出了一种基于关键词加权的共词分析方法,通过在关键词词频统计和词对相似度计算两个步骤中使用的改进的加权算法,从而实现了基于关键词重要性的加权。  相似文献   

8.
[目的/意义] 从关键词语义类型和学术文献老化两个维度出发挖掘学术论文价值,为学者推荐符合其研究需求并在时间维度上具有较大参考意义的学术论文。[方法/过程] 首先,将学术论文关键词按语义类型进行划分|随后,基于共现关系计算同类型关键词间相似度,基于关键词相似度得到论文在语义类型上的相似度|然后,借用文献老化思想,计算不同类型论文的时间价值|最后,结合论文在语义类型上的相似度及时间价值,生成论文推荐列表从而进行推荐工作。[结果/结论] 实证结果表明,使用该方法推荐的论文,一方面与学者研究方向相符|另一方面在时间维度上也具有较大价值,推荐的论文质量较高。  相似文献   

9.
章成敏  鞠海燕 《情报杂志》2005,24(11):101-103,105
综合考虑查询串所包含关键词的词形、语义、语用三个层面的信息计算查询串相似度的计算方法。首先利用字面相似度算法计算查询串在词形上的相似度,然后利用义类词典进行关键词在语义层面上的匹配,得到查询串在语义层面上的相似度,接着以搜索引擎作为语料库来源,将查询串提交给搜索引擎,通过对返回结果中重叠部分的统计分析,计算查询串在语用上的相似度,最后综合这三个相似度,完成相似度的计算。实验结果表明该算法的有效性。  相似文献   

10.
本文提出了一种能够同时考虑关键词和发生时间的新型算法。该算法首先对数据预处理后,建立微博事件集合的LDA模型,生成主题词集合作为事件的描述标志,通过DTW算法对事件关键词间的语义、时序相似度进行计算,得到对应的相似度矩阵,最后采用协同训练普聚类方法,迭代生成最终的特征向量并完成事件选取。仿真实验结果表明,本文提出的算法同以往算法相比具有准确率高以及效率高的特点。  相似文献   

11.
文章提出一种基于混合图的在线社交网络个性化推荐系统,将用户社会关系网络和社会化行为融入信息推荐.该系统包括模型构建、推荐流程和算法设计三部分.首先构建了用户资源混合图,并讨论了混合图的构建方法及权重设置,再在构建的混合图上采用重启动随机游走进行顶点间相似度计算,得到个性化推荐列表,进行推荐.  相似文献   

12.
【目的/意义】通过网络表示学习方法学习和发现作者间的关联性,提高推荐准确率,更好地进行关联推 荐。【方法/过程】基于2010-2017 年中国管理科学领域的数据构建基于网络表示学习的作者合作推荐模型,通过多 关系映射获取到的多关系序列作为语料库,采用Word2vec 方法进行网络表示学习训练,并利用余弦相似度方法计 算作者间相似度。【结果/结论】本文算法推荐精度达到82.8%,其推荐精度显著提高;融合元路径(元结构)特征的推 荐精度大幅提高,能为作者合作伙伴的选择提供建议和参考,对实践具有一定的指导意义。  相似文献   

13.
文章提出一种改进的关联规则方法,用于抽取文本中的非分类关系。首先利用基于上下文的术语相似度获取方法得到术语间的相似度权重,再通过加入谓语动词的关联规则算法计算,结合搜索引擎技术得到候选关系对集合,并通过置信度和支持度的对比分析,抽取最终的非分类关系结果,最后对测试数据进行实验,并对结果进行分析。  相似文献   

14.
作者关键词共现网络及实证研究   总被引:1,自引:0,他引:1  
以中国期刊网(CNKI)为数据源,构建作者—关键词共现网络,采用社会网络分析方法和Pathfinder net-works算法,选取国内图书情报研究领域进行实证分析.研究结果表明:2-模网络可视化图能够直接揭示作者的主要研究领域,反映出作者学术兴趣的多样性,显示不同作者的相同研究领域,对学科领域结构的解读具有显性、客观的特点;节点中心度分析反映出作者和关键词在网络中位置的重要性.  相似文献   

15.
标签和词已经成为Web2.0的重要元素.通过对不同领域间标签与关键词的相似度的分析入手,来分析领域问标签与关键词相似度的差异.进一步来探讨差异存在的原因和影响因素,从而揭示了网络用户的行为特点.  相似文献   

16.
针对本体映射中概念相似度计算中存在的一些不足之处,提出了一种改进的方法.通过WordNet计算两个概念名称和属性相似性,过滤出最相关的概念,减少概念相似度的计算;然后通过计算两个不同本体中的实例相似度和语义邻居相似度来完成本体映射.实验证明该方法效果良好.  相似文献   

17.
[目的/意义]关键词是反映期刊研究主题、研究方法和数据源等信息的重要途径。本文尝试通过论文关键词来研究学术期刊的相似度,为期刊分类等学术研究和实际工作提供参考。[方法/过程]首先,在相关文献梳理的基础上,提出了基于论文关键词的两种期刊相似度计算方法。然后,以《中国图书馆学报》和《情报学报》为实证对象,从CSSCI采集了两种期刊1998-2017年的关键词数据。最后,计算了两种期刊的相似度,并分析了两种期刊论文的共现关键词。[结论]研究发现,两种期刊的相似度有一定波动,但整体上呈现为一个下降趋势。这反映出两种期刊上发表的论文的相似性在不断下降,而差异性在不断增加。  相似文献   

18.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

19.
基于改进VSM的中文问答系统研究   总被引:1,自引:0,他引:1  
针对向量空间模型中的权重计算公式仅考虑词语项在文档中的相关频数,提出词语项本身的领域权重概念,改进了向量空间模型的权重计算.同时结合关键词距离和关键词顺序信息,实现了句子相似度计算,以特定课程的FAQ库检索作S@n测试对比,结果表明改进后的相似度模型提高了s@n值  相似文献   

20.
文章提出的适用于关联数据资源集相似度计算的综合描述信息模型,分为基本描述、内容描述和外部链接3个模块描述资源集,并根据各信息项的特点挑选字符串相似度、集合相似度、向量空间模型和基于统计和语义的相似度等算法计算资源集相似度,在一定程度上解决了当前关联创建中相关资源集手工配置的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号