首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
跨语言文本相似度计算在跨语言信息检索、数据挖掘、抄袭检测等领域有着重要应用,但是跨语言文本相似度计算因为不同语言文法、结构等问题,在空间映射、特征选择上与单语言文本相似度计算有很大差异。为解决上述问题,采用一种基于文本加权词共现关系的跨语言文本相似度计算方法,通过平行语料库构建跨语言词共现关系模型,使用该模型进行跨语言文本映射,对不同语言的文本进行相似度计算。该模型实际反映了某种语言中某些关键词共同出现时映射成另一种语言时的关键词概率分布。实验表明,该方法对跨语言文本排序的计算更接近人工评判标准。  相似文献   

2.
文本相似度计算是文本分类、文本聚类、自动文摘、信息抽取的基础.文本相似度计算性能直接影响到文本分类、文本聚类、自动文摘的质量.另外文本相似度还应用于诸多自然语言处理任务中,本文对文本相似度计算问题进行了深入的研究,并根据自然语言的特点提出了通过比较两个文本关键语义对来计算文本的语义相似度.  相似文献   

3.
针对短语文本的分类、聚类、信息查询问题,提出了一种新的中文短语文本相似度计算方法.用该方法计算出的文本相似度及一个比较文本与多个被比较文本所得相似度变化趋势是合理的,因此可以满足短语文本分类/聚类和信息查询的需要.  相似文献   

4.
ICF理念下残疾人康复服务人才队伍建设新探   总被引:1,自引:0,他引:1  
近年来,我国残疾人康复服务的需求正在发生着改变,国际上一些新的有关残疾、健康、康复的理念也逐渐被我国康复领域的学者及从业人员所认识与接受。其中,《国际功能、残疾和健康分类》(ICF)的提出,让全世界对残疾与健康有了新的理解,也对残疾人的康复服务有了新的思考。我国残疾人康复服务人才正处于亟待发展壮大的阶段,因此从ICF的理念出发,以ICF理念对我国康复服务人才队伍建设的启示及残疾人对康复服务的需求为主要依据,搭建了适合我国康复服务的人才队伍,并深入分析了ICF对残疾人康复服务人才队伍建设的支持。  相似文献   

5.
提出了一种新颖的基于实例的本体映射方法,即通过遗传算法确定最优实例间的映射集合,并通过相似度扩散算法获取高准确率的本体映射结果.文章描述了实例相似度度量技术和upPropagation算法,给出了本体映射问题的单目标优化模型,论述了使用遗传算法求解该问题的3个关键步骤,最后通过实验验证.实验表明,采用遗传算法实现基于实例的本体映射方法,可以获取高准确率的本体映射结果.  相似文献   

6.
提出使用文本相似度算法与DBSCAN聚类算法相结合的方法对文本进行聚类,实现对文本的管理。首先对文本进行特征提取和分词操作,在分词过程中会产生大量的特征词汇,而有些特征词汇对文本特征的表达并无实际意义。因此,在文本特征提取过程中根据特征词汇对文本特征表达的贡献度进行取舍,以提高文本聚类的效率和准确性。利用TF IDF方法对特征词汇进行加权,并且对文本进行相似度计算,将相似度低于阈值的文本作为孤立点进行处理。利用DBSCAN算法对文本进行聚类,将相似的文本聚为一类。  相似文献   

7.
提出了一种自动完成本体映射的算法.该算法通过计算本体概念之间元素层与结构层上的相似性来完成相似度的计算.在元素层上,该算法引进了WordNet,通过将WordNet中对应的概念转换为向量,计算向量间夹角的余弦得到元素层概念的相似度.在结构层上,该算法通过加权函数和sigmoid函数,基于元素层的计算结果,将元素层的相似度和结构层的相似度结合起来,完成本体之间相似度的计算,最终完成映射.实验结果表明,该算法的匹配准确率可以达到63%~70%,可以有效地完成本体之间的映射.  相似文献   

8.
为改善传统个性化推荐算法精准度不高的问题,使用评论数据作为数据集,先对评论数据作文本预处理和特征提取,然后使用LDA主题模型对文本特征数据建模,得到主题词分布,将其作为标签,同时使用LSTM网络作文本分类,通过计算得到好评率。最后把用户需求和标签利用潜在语义标引计算相似度,根据相似度和好评率大小向用户推荐结果。实验结果表明,该方法能够向用户推荐符合其兴趣的个性化需求信息,且准确率高于96%,证明了该推荐算法的有效性。  相似文献   

9.
Deep web数据集成需要对web查询接口进行模式匹配并获得映射关系.在web查询接口集成中引入语义冲突的概念,通过分析语义冲突的起源和分类,提出了一种基于本体的模式匹配方法.以房产领域的web查询接口集成为实例,详细阐述了这种方法的具体过程:通过比较语义相似度自动检测不同查询接口之间存在的语义冲突,识别冲突类别并且给冲突解决器发送消息,冲突解决器借助领域专家定义推理规则来消除冲突获得映射表.使用检测和解决语义冲突的方法来进行模式匹配,算法简单易于实现,扩充本体定义就可以使用于不同领域,灵活性和重用性较好.  相似文献   

10.
一、什么是ICF ICF,即《国际功能、残疾和健康分类》(International Classification of Functioning Disability and Health),可简称《国际功能分类》,它是1980年出版的《国际损伤、残疾和障碍分类》(ICIDH)简称《国际残疾分类》的修订版本,已经于第五十四届世界卫生大会(2001年5月)上被190个成员国签署在国际上使用.  相似文献   

11.
郭丽  刘磊 《教育技术导刊》2013,12(4):130-131
实体关系抽取和实体关系分类是信息抽取中重要的研究领域,不仅要识别文本中的实体,还要确定这些实体之间的关系,能够辅助机器对文本语义的理解。提出了一种基于关系相似度计算的实体关系分类模型,并针对7种常见实体关系进行了分类实验。  相似文献   

12.
利用API服务和Mashup应用的注册和组合信息,通过构建Mashup-API网络和API-API网络,在LFH方法的基础上改进Rada & Courtney算法,进行API服务的标签相似度、描述相似度和摘要相似度的计算并最终计算其服务相似度,基于服务的使用场景提出了相应的服务推荐算法,实现了协作关系、竞争关系和其他关系的服务推荐.使用ProgrammableWeb上Mashup应用和API服务的真实数据为载体验证了方法的可行性和有效性,在服务分类和服务推荐方面具有一定的意义.  相似文献   

13.
通过对目前各种本体映射方法的分析,提出一种改进的本体映射的方法.该方法考虑了概念的名称、实例、属性、关系对相似度计算的影响,使概念相似度的计算更加全面、准确.  相似文献   

14.
采用本体概念映射方法,研究概念间相似度计算问题并提出本体图驱动的概念相似度算法。该算法将概念映射到本体结构图上,通过计算概念的语义、结构及属性相似度得到综合相似度。其中,结构相似度通过语义辐射圆计算模型得到,属性相似度通过概念重心向量夹角余弦得到。通过实验对比证明,该算法在一定程度上提高了相似度准确性,为数据挖掘提供了一定依据。  相似文献   

15.
针对信息集成中的语义异构问题,提出了一个基于本体的语义信息集成模型OSII,并给出了逻辑框架.OSII采用混和本体方式建模,以OWL描述本体,通过局部本体与全局本体之间的映射获得多源统一视图.提出了一种基于树结构的多策略本体映射算法,该算法包含4个步骤,即预处理,名称映射,子树映射和映射矫正.其特点在于:按照数据类型分类进行映射,并采用启发式规则,提高映射效率;同时考虑概念的语言相似性和结构相似性,提高相似度计算的准确性;采用迭代矫正,最终得到正确而完整的映射对.通过一个挑战性的实例说明了算法的有效性.OSII能很好地解决信息集成中的语义异构难点,实现多信息源之间的互操作.  相似文献   

16.
为了更好地组合不同的相似度度量结果以提高本体映射结果的质量,提出一种新的基于调谐值度量和单纯降序提取算法的自动化本体映射技术。该技术首先通过调谐值来度量各种相似度矩阵的可靠性,并为每一个相似度矩阵赋予权重以集成不同的相似度矩阵,然后通过单纯降序提取算法结合阈值的策略提取最终的本体映射结果。实验采用2012年本体映射评价竞赛的测试数据集,同2012年本体映射评价竞赛的参与者的比较表明该文提出的方法是有效的。  相似文献   

17.
传统的文本信息过滤算法仅能实现结构对应层次上的判断,无法体现文本的语义.本文介绍一个能对Web页文本信息进行语义过滤的系统,通过分词、生成语义框架和计算框架间相似度,对相似度大于阈值的Web页进行过滤.试验表明,语义过滤能较好地甄别文本的不同观点,准确度较单纯关键字过滤有明显提高.  相似文献   

18.
MLS模型作为一种逼近模型被广泛应用于数据光滑、数值分析和统计等诸多领域.文章将MLS模型用于最优本体函数的计算,将本体图中每个顶点映射成实数后,通过顶点对应实数间的差值来确定它们的相似度.将新本体算法应用于GO本体和物理教育本体,通过实验结果表明新算法对特定应用领域的相似度计算和建立本体映射是有效的.  相似文献   

19.
微博的普及导致微博平台数据量日益增长,因此从海量微博中快速准确地为微博用户推荐好友成为了巨大挑战。用户的社交网络和微博文本在一定程度上体现了用户的价值观和兴趣爱好,有相似兴趣的微博用户更有可能成为朋友。基于上述事实,以用户微博文本相似度为似然函数,使用K-means聚类对微博用户聚类,得到微博用户社交圈;在社交圈内部迭代计算用户之间的相似度,同时计算用户对其所在社交圈中其余用户的信任度;最后,根据用户之间的相似度和信任度完成微博好友推荐。实验结果表明,该算法优于传统的基于社交网络拓扑图的好友推荐方法。  相似文献   

20.
脑中风具有很高的发病率和致残率,而康复治疗是目前降低患者致残率的有效手段。为了系统化地进行康复评估,我们总结了研究和临床应用中常用的评估方法,包括各种类型的脑卒中康复量表及其适用性,以及相关的生物医学检测技术:表面肌电图、运动分析系统、经颅磁刺激、磁共振成像以及不同技术的组合。此外,我们还介绍了一些仍处于实验阶段的评估技术,如人工智能与光学相关断层扫描在中风康复的前瞻性应用。因此,本综述不仅为评估脑卒中损伤程度,也为评估脑卒中康复过程中的治疗效果提供了有价值的参考,同时为今后脑卒中康复技术的发展奠定了坚实的基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号