首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义] 从关键词语义类型和学术文献老化两个维度出发挖掘学术论文价值,为学者推荐符合其研究需求并在时间维度上具有较大参考意义的学术论文。[方法/过程] 首先,将学术论文关键词按语义类型进行划分|随后,基于共现关系计算同类型关键词间相似度,基于关键词相似度得到论文在语义类型上的相似度|然后,借用文献老化思想,计算不同类型论文的时间价值|最后,结合论文在语义类型上的相似度及时间价值,生成论文推荐列表从而进行推荐工作。[结果/结论] 实证结果表明,使用该方法推荐的论文,一方面与学者研究方向相符|另一方面在时间维度上也具有较大价值,推荐的论文质量较高。  相似文献   

2.
为建立知识管理系统的自学习与自组织机制,本文将基于案例推理的技术思想引入知识管理自学习子系统,对知识管理自学习案例的平行结构体方面相似度进行系统而深入地研究。首先,论文对相关文献进行述评,阐明了本文研究的出发点,诠释了知识管理自学习案例平行结构体方面的内涵及其特征;继而,分七种情况深入讨论了平行结构体方面维度相似度的计算方法,并在此基础上提出了方面相似度的计算策略;最后,通过算例分析了相关技术策略与实施细节。  相似文献   

3.
基于语义相似度的信息检索研究   总被引:2,自引:0,他引:2  
如何准确表达用户意图,判定概念实体之间的语义相似度是语义信息检索技术中的一个重要研究方向.综舍考虑实例多重继承关系及属性值的层次关系,提出了一种语义相似度计算方法,并利用继承关系的树状结构特点对语义相似度的计算过程进行了优化.在实例多重继承关系相对复杂的情况下准确率提高更加明显.实验表明本文提出的算法,在本体知识库的多种组成情况下,均能有效地提高相似度的计算准确率.  相似文献   

4.
盛秋艳 《情报科学》2012,(8):1238-1241
本体技术作为一种能在语义和知识层次上描述概念体系的有效工具,给词语间相似度计算带来了新的机会。词语相似度的研究,是知识表示以及信息检索领域中的一个重要内容。本文利用本体来组织概念,计算概念之间的语义相似度,将语义相似度分成概念相似度和描述相似度,把概念相似度和描述相似度进行合并,生成最终的语义相似度。依据《中国分类主题词表》建立的计算机领域本体,验证了语义相似度计算方法的有效性。  相似文献   

5.
概念语义相似度计算与参数估计   总被引:1,自引:0,他引:1  
语义相似度计算是信息处理技术中的算模型,对模型中的参数取值进行了详细的讨论.在此基础上,利用<农业叙词表>中的实际数据进行了实证分析,计算结果与常识判断基本一致.其研究目的在于试图从实用的角度出发,为概念语义相似度计算作一些尝试和探索.  相似文献   

6.
针对本体映射中概念相似度计算中存在的一些不足之处,提出了一种改进的方法.通过WordNet计算两个概念名称和属性相似性,过滤出最相关的概念,减少概念相似度的计算;然后通过计算两个不同本体中的实例相似度和语义邻居相似度来完成本体映射.实验证明该方法效果良好.  相似文献   

7.
【目的/意义】随着我国科技水平的不断提升,越来越多的科研人员致力于研究如何客观有效地评估科技论 文的质量。【方法/过程】本文提出了基于文本挖掘和文献计量的科技论文评估方法,该方法首先利用论文的引用 频率计算得到训练论文的质量,其次分别使用LSI和LDA方法来计算新论文和训练论文之间的相似度,设计论文质 量评估算法,根据训练论文的质量和论文间的相似度加权计算得到新论文的质量评价值。【结果/结论】在涉及多主 题和单一主题的数据集上的实验结果表明,本文提出的方法能够适用于包含多个主题的论文集,其计算出来的论 文质量值真实有效。  相似文献   

8.
现有的相似度计算方法大都依赖于作者间的直接关联,忽略了间接关联.文章提出一种新的基于SimRank的作者相似度计算方法,充分考虑作者关键词二分图网络的整体结构特性,利用图结构相似度算法挖掘出作者间以及词汇间的潜在关联关系.初步实验表明该方法能够有效地识别作者之间的相似度,相比于传统的关键词耦合,该方法可以明显提高作者相似度计算的准确性.  相似文献   

9.
[目的/意义]关键词是反映期刊研究主题、研究方法和数据源等信息的重要途径。本文尝试通过论文关键词来研究学术期刊的相似度,为期刊分类等学术研究和实际工作提供参考。[方法/过程]首先,在相关文献梳理的基础上,提出了基于论文关键词的两种期刊相似度计算方法。然后,以《中国图书馆学报》和《情报学报》为实证对象,从CSSCI采集了两种期刊1998-2017年的关键词数据。最后,计算了两种期刊的相似度,并分析了两种期刊论文的共现关键词。[结论]研究发现,两种期刊的相似度有一定波动,但整体上呈现为一个下降趋势。这反映出两种期刊上发表的论文的相似性在不断下降,而差异性在不断增加。  相似文献   

10.
黄莉  李湘东 《情报杂志》2012,31(7):177-181,176
KNN最邻近算法是文本自动分类中最基本且常用的算法,该算法中需要计算文本之间的相似度.以Jensen-Shannon散度为例,在推导和说明其基本原理的基础之上,将其用于计算文本之间的相似度;作为对比,也使用常规的余弦值方法计算文本之间的相似度,并进而使用KNN最邻近算法对文本进行分类,以探讨不同的相似度计算方法对使用KNN最邻近算法进行文本自动分类效果的影响.多种试验材料的实证研究说明,较之于余弦值方法,基于Jensen-Shannon散度计算文本相似度的自动分类会使分类正确率更高,但会花费更长的时间.  相似文献   

11.
[目的/意义]引入IMRD架构对论文的关键词进行细分与归类,有利于挖掘各类关键词的潜藏信息,丰富论文创新性评价指标的层次结构和内容,从而提升评价指标的精确性、科学性。[方法/过程]应用文本处理技术和LDA主题模型提取论文的关键词,根据IMRD架构将论文的关键词分为Topic关键词和Method关键词,结合两类关键词的相似度和相似论文数量等因素计算论文相似值,继而根据关键词的类别特征分别构建Topic关键词学科热度值、学术潜力值及Method关键词创新性的数学模型。最后,整合论文创新性的各种影响因素,构建一个多维度、多层次的论文创新性评价指标。[结果/结论]以CNKI数据库中“篇关摘”含有“自然语言处理”的中文期刊论文为实证对象,结果表明本文构建的创新性评价指标能有效区分具有不同创新水平的论文。  相似文献   

12.
李慧 《现代情报》2015,35(4):172-177
词语相似度计算方法在信息检索、词义消歧、机器翻译等自然语言处理领域有着广泛的应用。现有的词语相似度算法主要分为基于统计和基于语义资源两类方法,前者是从大规模的语料中统计与词语共现的上下文信息以计算其相似度,而后者利用人工构建的语义词典或语义网络计算相似度。本文比较分析了两类词语相似度算法,重点介绍了基于Web语料库和基于维基百科的算法,并总结了各自的特点和不足之处。最后提出,在信息技术的影响下,基于维基百科和基于混合技术的词语相似度算法以及关联数据驱动的相似性计算具有潜在的发展趋势。  相似文献   

13.
高楠  高嘉骐  陈洪璞 《情报科学》2023,(3):127-135+172
【目的/意义】通过综合使用论文和专利数据源,开展新兴技术的识别与演化路径方法研究,期望以此提高学科领域新兴技术探测研究的准确性和科学性。【方法/过程】首先,针对集成电路这一特定领域使用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,并利用LDA主题模型发现并识别集成电路领域隐含的技术主题,构建新颖度、强度和热度等多维指标对新兴技术进行对比和甄别。其次,划分时间窗,采用余弦相似度算法计算相邻时间窗内主题间的相似性,以可视化路径的形式将筛选结果进行呈现,以此判断主题演化关系类型。【结果/结论】研究发现,集成电路领域呈现学界与业界研究成果相互促进的良好态势,结合论文与专利数据的新兴技术识别方法,可以有效且清晰的发现集成电路研究领域的热点型、增长型、成熟型和潜在型技术主题,并通过新兴技术演化路径的构建,揭示了领域科学与技术间知识的交互与转移。【创新/局限】本研究创新性采用Word2Vec语义相似度与字符串相似度相结合的方法构建词袋,提高了词袋构建质量,为后续基于LDA主题模型识别隐含的技术主题奠定了基础,但在数据源的多样性、时滞性问题,以及模型阈值设置的客观性上还存在局限性,需要...  相似文献   

14.
基于本体匹配的语义对等网信息检索   总被引:2,自引:0,他引:2  
提出了一种基于语义相似、本体匹配的对等网信息检索方法.定义语义节点,在节点中通过计算语义相似度,在网络中进行语义匹配来部分替换传统的字符串相似度计算.仿真模拟结果表明,该方法能够有效提高信息检索效率.  相似文献   

15.
[研究目的]精准辨别竞争对手,有助于企业客观分析自身所处竞争局面,为其制定差异化竞争策略提供决策支持。[研究方法]首先以专利说明书中技术背景、技术方案、技术功效为研究文本,在融入权重的基础上,计算目标-对手企业单件专利个体技术相似度;然后依质量对专利进行核心、重点、一般分类,在融入专利质量、个体技术相似度、行业分类代码、IPC分类号的基础上,计算目标-对手企业整体技术相似度,并通过构建整体技术相似度-专利平均质量战略坐标,对竞争对手进行辨别分类;最后以人工智能为研究领域、以百度为目标企业验证了本方法的可行性和有效性。[研究结论]通过融入专利情境、优化技术相似度计算方法,能够更加全面、细腻、准确地辨别竞争对手,使辨别结果更加贴近企业所处的行业竞争实际环境,契合企业制定竞争策略的实际需求。  相似文献   

16.
围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模型的相似度计算,基于短语的相似度计算方法和基于本体的相似度计算方法。  相似文献   

17.
【目的/意义】文本相似度计算是自然语言处理中的一项基础性研究,通过总结和分析文本相似度计算的经 典方法和当前最新的研究成果,完善对文本相似度计算方法的系统化研究,以便于快速学习和掌握文本相似度计 算方法。【方法/内容】对过去20年的文本相似度计算领域的经典文献进行整理,分析不同计算方法的基本思想、优 缺点,总结每种计算方法的侧重点和不同方向上最新的研究进展。【结果/结论】从表面文本相似度计算方法和语义 相似度计算方法两方面进行阐述,形成较为全面的分类体系,其中语义相似度计算方法中的基于语料库的方法是 该领域最为主要的研究方向。  相似文献   

18.
协同过滤技术被广泛应用于各种推荐系统当中。协同过滤中的核心问题是相似度的计算,本文在介绍传统相似度计算方法的基础上,提出一种新的计算方法,以基于物品为例进行了实验,实验证明该方法在推荐精度上得到一定程度的提高。  相似文献   

19.
廖开际  杨彬彬 《情报杂志》2012,31(7):182-186
基于词频统计思想的传统文本相似度算法,往往只考虑特征项在文本中的权重,而忽视了特征项之间的语义关系.综合考虑了特征项在文本中的重要程度以及特征项之间的语义关系,提出构建文本特征项的加权语义网模型来计算文本之间的相似度,并在模型构建的过程中,对特征项的选取、权值计算做了适当的改进.最后用实验验证了基于加权语义网的文本相似度算法相较于传统的算法,相似度计算的精确度有了进一步的提高.  相似文献   

20.
随着信息技术的飞速发展,自然语言处理越来越受到人们的重视,句子相似度计算在自然语言处理领域具有非常重要的地位。基于二元文法模型的汉语句子相似度计算方法以相邻关键词共同出现进行加权的方式计算句子相似度。方法重点考虑关键词词形和句长相似度,还适当考虑了近义词的情况。实验结果表明,该方法可以更好的处理句子长度差较大的句子相似度,在计算汉语句子相似度时准确率高于关系向量模型的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号