首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
针对当前基于《知网》的词义相似度算法未充分考虑义原所具有的情感极性信息,以及未充分利用义原在义项表达式中的位置信息等问题,提出了一种改进的基于《知网》的词义相似度算法。首先,在计算义原相似度时,对现有的考虑义原距离以及义原深度的计算方法,引入义原情感极性作为新的参数,使得对包含情感色彩的词语的词义相似度计算结果更加精确;其次,对义原在义项表达式中的位置信息进行更加深入的分析,提出了一种新的位置权重分配方法,以增强词义相似度计算结果的合理性。实验结果表明,与已有方法相比,所提出的方法可有效提高词义相似度计算的精确度与合理性。  相似文献   

2.
词义消歧在多个领域有重要应用。基于Lesk及其改进算法是无监督词义消歧研究的典型代表,但现有算法多基于上下文与义项词覆盖,通常未考虑上下文中词与歧义词的距离影响。为此提出一种基于词向量的词义消歧方法,利用向量表示上下文以及义项,并考虑融合上下文与义项的语义相似度及义项分布频率进行词义消歧。在Senseval-3数据集上测试,结果表明,该方法能有效实现词义消歧。  相似文献   

3.
源码相似性度量是代码推荐、缺陷监测、代码搜索等很多软件工程领域任务的基础工作.传统的源码相似性度量方法主要利用统计方法从代码的结构属性、文本特性两方面进行度量,缺乏对代码的语义相似性研究.为解决此类问题,在词嵌入基础上提出结合TF-IDF和Word2vec的向量空间模型,利用向量间距离衡量代码间的相似性,融合代码的语义...  相似文献   

4.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率.  相似文献   

5.
介绍了一种利用<同义词词林>和训练语料生成义类代码同现频率矩阵,以此作为资源进行真实语料中多义词的词义排歧.由于该方法采用无指导的学习方法,可以免除人工标注的开支,而且具有较好的移植性.  相似文献   

6.
7.
杨立波 《太原大学学报》2011,12(1):111-113,116
基于CFN的相似度计算是一种相似度计算算法、将此算法与实例机器翻译联系,通过语法,语义两个角度对句子进行观察和分析,并经过CFN标注汉语句子,从两个层面进行相似度计算,并建立实例相似度计算模型,使基于CFN的相似度的计算方法更为简便。  相似文献   

8.
针对目前食品安全问答系统准确率不高且无法满足智能化问答要求等问题,基于词向量相似度设计食品安全问答系统。采用深度学习方法构建食品安全领域知识库及词向量模型,结合近义词库提出问句相似度计算方法,将问句与知识库内所有问句进行匹配,返回相似度最高问句对应的答案。实验结果表明,该系统问答准确率达到80%,能满足食品行业用户的日常问答需求。  相似文献   

9.
句子相似度计算模型在基于实例的机器翻译中有着举足轻重的地位。提出了一种基于多特征加权的句子相似度计算模型,在对中文句子的词形、词序、句法和语义4种特征相似度计算的基础上,融合这4种特征,通过采用不同的特征权重来调节不同特征对句子相似度计算的影响,使得句子相似度计算更加准确。实验结果表明,该算法在计算句子相似度方面准确性较高。  相似文献   

10.
查询扩展是信息检索领域重要研究内容。为了解决信息检索过程中用户提交查询时描述不准确以及查询词不匹配的问题,提出一种基于Word2vec的语义查询扩展方法。使用分布式神经语言概率模型Word2vec训练低维词向量,选取扩展词候选集,利用面向扩展词的查询向量生成方法过滤候选集,使选取的扩展词能更有效地体现整个查询的语义及语法相关性。实验结果表明基于Word2vec的语义查询扩展方法使查全率及查准率均有提高,因此该方法能很好地应用于查询扩展领域。  相似文献   

11.
语言发展是渐变的,词义的发展演变亦如此。对词义演变的探讨要从共时和历时的角度出发,因为纵观古今词义的演变不难发现,词义演变不仅仅是扩大、缩小和转移那样简单。本文试从词义深化、词义范围的变化和词义转移三方面探讨词义演变的情况。  相似文献   

12.
对古汉语词义发展的研究,历来训诂学家都颇为重视.近三十年来,更是取得了一系列的研究成果,主要包括对具体词语词义演变的研究和词义演变规律的研究.这些研究也存在一些问题,需要加以完善.  相似文献   

13.
传统句子相似度算法没有全面考虑句子结构与语义特征,影响相似度计算准确性,对此提出一种基于句法块向量的句子相似度计算方法。该方法综合考虑句子的语义信息与结构信息,首先构建两句子的语义依存关系树,然后进行一些被动转换等操作,最后根据词向量构建各个句法块向量并通过余弦值计算句子相似度。在常规句子对中进行测试实验,结果表明,综合句子结构与语义信息可提高相似度计算准确性。一般句子相似度计算正确率达到92%,比传统方法提高8%~10%。  相似文献   

14.
从语言学的角度考察俄语词义与语境二者的依存关系,即语言创造语境,语境产生语义.通过论述言语矛盾产生的原因及其在词义理解中的体现,指出言语交际中应避免言语矛盾,创造语境,以期达到最佳的言语交际效果.  相似文献   

15.
词义引申在词义研究中占有重要的地位,自古至今人们对“词义引申”这一概念及现象的研究有一个从不自觉到自觉的过程。主要立足于清代,以时间为线索对“词义引申”的概念界定和相关研究的发展作一梳理。  相似文献   

16.
篇章通常是一个有机的整体,语义连贯,语句关联。充分理解原是翻译的前提,有效落实译是翻译的关键。词是语言中可以自由运用的最小单位,而词义受语境的制约,脱离了具体语境,词义便无从确定。  相似文献   

17.
布政传令、直接作用于现实的公同样要在炼辞炼意上下功夫。炼意必须炼辞,炼辞即为炼意。言随意遣,辞以达意;理逐言深,语以精义。要达到言意谐适和言意相资相促是有蹊径可寻、有规律可循、有方法可用的。  相似文献   

18.
词的比喻义与“城”字现象   总被引:2,自引:0,他引:2  
词语适应社会发展的需要,不断变化发展,变化发展的方式之一是在原词的基础上派生出新的比喻义。本文结合“城”字现象,从比喻的本质特点和结构形式阐明词的比喻义的产生过程和被社会接受的若干条件。  相似文献   

19.
模糊性是自然语言的本质特征之一。语言中的模糊现象存在于语音、词汇、语法中。从对语言模糊性的研究来看,尤以词汇层面的语义模糊的研究成果最为显著。论文对20世纪后期国内外有关词义模糊的主要研究作一简要评述,为以后的词义模糊研究指明方向,提供一种理论上的依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号