首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
句子相似度计算模型在基于实例的机器翻译中有着举足轻重的地位。提出了一种基于多特征加权的句子相似度计算模型,在对中文句子的词形、词序、句法和语义4种特征相似度计算的基础上,融合这4种特征,通过采用不同的特征权重来调节不同特征对句子相似度计算的影响,使得句子相似度计算更加准确。实验结果表明,该算法在计算句子相似度方面准确性较高。  相似文献   

2.
传统句子相似度算法没有全面考虑句子结构与语义特征,影响相似度计算准确性,对此提出一种基于句法块向量的句子相似度计算方法。该方法综合考虑句子的语义信息与结构信息,首先构建两句子的语义依存关系树,然后进行一些被动转换等操作,最后根据词向量构建各个句法块向量并通过余弦值计算句子相似度。在常规句子对中进行测试实验,结果表明,综合句子结构与语义信息可提高相似度计算准确性。一般句子相似度计算正确率达到92%,比传统方法提高8%~10%。  相似文献   

3.
百度知道中用户提出问题较短,采用常规基于空间向量的 TF-IDF 句子相似度计算、基于语义依存关系的句子相似度计算等方法往往很难较好完成其相似度计算。鉴于此,基于长度较短问句的特点,引入问题元和词模思想,对用户问题进行分解,并与传统相似度计算方法相融合,提出新的相似度计算方法。对于长度低于20 个词的问句,与传统 TF-IDF 方法相比,F1 值提高了 12%。  相似文献   

4.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率.  相似文献   

5.
安玲 《林区教学》2014,(9):91-93
提出了一种基于测地距离的多文档摘要方法。该方法首先利用可以揭示高维向量相似度的测地距来代替传统的向量夹角作为句子相似度的对比基础,然后通过TextTiling算法进行分割文本,利用基于Wordnet的概念向量空间模型消歧计算段落相似度来构建"文本关系图"产生文摘。在DUC上的实验结果表明,该算法能够有效地生成非受限领域的多篇文档摘要并全面反映文档的主要内容并能有效地提高文档摘要的质量。  相似文献   

6.
本文针对教务管理系统学生选课自动问答系统,提出一种语句相似度计算方法.该方法先采用基于布尔型VSM掩码的方法实现问题的初分类,再采用改进的编辑距离算法计算句子相似度来判断FAQ库的匹配,从而使系统返回问题的答案.实验结果表明该方法可行.  相似文献   

7.
提出了一种新颖的基于实例的本体映射方法,即通过遗传算法确定最优实例间的映射集合,并通过相似度扩散算法获取高准确率的本体映射结果.文章描述了实例相似度度量技术和upPropagation算法,给出了本体映射问题的单目标优化模型,论述了使用遗传算法求解该问题的3个关键步骤,最后通过实验验证.实验表明,采用遗传算法实现基于实例的本体映射方法,可以获取高准确率的本体映射结果.  相似文献   

8.
协同过滤算法是最常用、最经典的个性化推荐算法之一。在算法计算中相似度计算是影响算法质量的关键因素,该算法中相似度计算根据用户评分差值作为距离来衡量,忽略了项目自身特征属性对相似性计算的制约。因此提出一种基于项目特征的协同过滤推荐算法(IFCF),结合项目评分相似度,利用Logistic二分类算法思想将用户对项目的偏好分为喜爱与不喜爱两类,再利用贝叶斯概率原理将用户对各项目特征的喜爱程度差值作为相似度调整度,以达到提高项目相似性度量准确度的目的。实验结果表明,该算法能够有效提高推荐算法的精度。  相似文献   

9.
介绍了当前国内外有关词汇语义相似度算法的研究现状,分析并对比了几种具有代表性的计算方法,并将几种常用的词汇语义相似度算法应用于FAQ中,分别采用准确率、召回率、F值以及MRR、MAP5个指标进行评价,根据相似问句的检索效果判断各词语相似度算法的优劣。  相似文献   

10.
搜索引擎是目前最主要的WWW信息检索的工具,然而,用户对当前搜索引擎的检索效果并不满意.论文给出了基于文档文本内容和文档间超链信息的混合相似度计算方法,并给出了基于混合相似度的模糊(软)聚类算法HTSC.对HTSC算法进行了理论分析,并对其中的核心算法进行了初步的实验验证.该算法可对搜索引擎返回的结果进行模糊聚类,以方便用户从中找到真正需要的信息.  相似文献   

11.
基于地图信息论的观点,将点群目标包含的信息重新分为统计信息、专题信息、拓扑信息、距离信息和方向信息.根据这5类信息描述参数的特点,给出了各个信息量相似度的计算公式.最后综合这5类信息给出了多尺度地理空间点群目标相似度的计算公式,并通过算例验证了公式的可行性和有效性,为地图综合质量的评价提供了一种新方法.  相似文献   

12.
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结构等问题,在空间映射、特征选择上与单语言文本相似度计算有很大差异。为解决上述问题,采用一种基于文本加权词共现关系的跨语言文本相似度计算方法,通过平行语料库构建跨语言词共现关系模型,使用该模型进行跨语言文本映射,对不同语言的文本进行相似度计算。该模型实际反映了某种语言中某些关键词共同出现时映射成另一种语言时的关键词概率分布。实验表明,该方法对跨语言文本排序的计算更接近人工评判标准。  相似文献   

13.
数据稀疏是协同过滤预测精度的一个重要影响因素。Slope One算法使用简单的线性回归模型解决该问题,但它只使用评分数据做计算,未考虑相似性。提出一种基于用户习惯偏好相似度的Slope One算法(UPS Slope One)。UPS Slope One首先基于用户习惯偏好聚类,得到三组不同偏好的用户,然后分别计算各组评分偏差,计算时将用户习惯偏好相似度融入其中,最后使用线性回归模型预测评分。在MovieLens数据集上的实验表明,该算法可得到更高的推荐质量、预测准确性和稳定性。  相似文献   

14.
基于格语法的问答系统实践   总被引:3,自引:0,他引:3  
自然语言处理是研究使用计算机理解和生成自然语言的基础理论和基本技术,是当前人工智能研究的核心课题之一。格语法是自然语言处理学科的一种基本理论,在诸多智能系统中获得成功应用。基于格语法的问答系统,就是把句子用格框架写好后建立句子库,提问时,把问题的格框架与句子的格框架进行匹配。给出答案。  相似文献   

15.
基于《知网》语义知识资源,提出一种基于问句相似度计算的问答社区问题去重方法。通过计算已有问题集合中问题间的语义相似度,将其中重复度较高的问题进行筛选并去除,从而提高用户获取所需信息的效率,改善用户体验。在“爱问知识人”的真实问题集上的实验结果表明:该方法获得了较好的去重效果。  相似文献   

16.
The dynamic securityregion(DSR) is definedas are-gionininjectionspacein whicha power systemwill betran-siently stable for a given fault[1].The DSRis usually de-noted asΩd(i,j,F) ,whereiandjdenote the networkstructures of pre-fault and post-fault ,respect…  相似文献   

17.
对《左传.宫之奇谏假道》一文中"且虞能亲于桓庄乎其爱之也"的句读,一般处理为"且虞能亲于桓庄乎,其爱之也?"把它当作一种特殊的倒装句来看待。如果换个角度来分析,却可以把这个语句理解为两个问句,即:"且虞能亲于桓庄乎?其爱之也?"照此处理,这个语句非但不是倒装句,其语义和语义关系都发生了变化。  相似文献   

18.
本文从认知语言学的理论角度,对英汉两种语中典型和特殊的被动句式进行了对比分析。文章认为,射体和界标的理论也可用于分析英语被动句式。最后讨论了英语被动旬式的认知翻译观等问题。  相似文献   

19.
提出了一种自动完成本体映射的算法.该算法通过计算本体概念之间元素层与结构层上的相似性来完成相似度的计算.在元素层上,该算法引进了WordNet,通过将WordNet中对应的概念转换为向量,计算向量间夹角的余弦得到元素层概念的相似度.在结构层上,该算法通过加权函数和sigmoid函数,基于元素层的计算结果,将元素层的相似度和结构层的相似度结合起来,完成本体之间相似度的计算,最终完成映射.实验结果表明,该算法的匹配准确率可以达到63%~70%,可以有效地完成本体之间的映射.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号