首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
蒋平 《文教资料》2007,(4):138-139
本文在简要评述了现阶段机器翻译的种种不足之处后,认为词义歧义是阻碍机译系统提高翻译质量的重要因素。之后,文章概括评价了现阶段机器翻译系统所采用的词义消歧方法,如基于语言学规则的词义消歧方法,基于大规模语料库中多义词与其他关键语境词同现关系的统计的消歧方法和基于不倚赖于语言学知识的翻译实例的消歧方法,并提出了尚存问题。  相似文献   

2.
计算机理解自然语言的瓶颈之一是词义的歧义性问题。词义消歧方法大体上可以分为两大类:基于定性的方法和基于定量的方法.要取得较好的词义消歧效果,将两结合是一条可行之道。本就这两的结合作了初步的研究和探讨.  相似文献   

3.
多义动词的歧义消解在词义消歧研究中占有重要的地位。本文在语料库词义人工标注工作的经验基础上,在从可利用的词汇知识资源、消歧策略的内部构成和原理层次、机用词典中动词义项分立等几个方面分析了动词词义消歧问题。提出了一个由动词词义知识库、语料信息、综合处理器三大部分,以及语法功能、语义关系、使用经验三个层面构成的动词词义消歧策略,并从这个角度对用于机器自动消歧的动词义项分立规则提出改进意见。  相似文献   

4.
词义消歧与框架-脚本理论   总被引:1,自引:0,他引:1  
对词义消歧(WSD)的研究,是人工智能科学、认知心理学、心理语言学等多种学科的热点课题.在过去的几十年里,各种各样的消歧理论体系不断被提出.文章对具有代表性的消歧体系进行简要介绍,并着重对框架-脚本理论运用于词义消歧的操作与意义进行了探讨.  相似文献   

5.
首先介绍了目前一些常用词义消歧方法及其研究进展,并在此基础上探讨了一种基于BP神经网络和统计方法相结合的有导词义消歧模型,最后详细讲解了BP神经网络原理,还对使用这种混合人工智能的消歧模型的可能性和优越性进行了讨论。  相似文献   

6.
词义消歧解决自然语言中同形异义词语在不同上下文环境中的义项标注问题,是自然语言处理领域的基础性关键问题.核方法是机器学习中一类强有力的统计学习技术,被广泛应用于分类、回归、聚类等诸多领域.基于核方法的词义消歧的关键是如何构造一个能够充分表达待消歧词上下文信息的核函数.在介绍基于核方法的词义消歧系统的一般框架之后,系统阐述了国内外面向统计词义消歧的核函数构造与选择的研究现状及进展,重点分析了研究中存在的问题及解决方法,最后探讨了未来研究的重点与可能的发展方向.  相似文献   

7.
词义消歧在多个领域有重要应用。基于Lesk及其改进算法是无监督词义消歧研究的典型代表,但现有算法多基于上下文与义项词覆盖,通常未考虑上下文中词与歧义词的距离影响。为此提出一种基于词向量的词义消歧方法,利用向量表示上下文以及义项,并考虑融合上下文与义项的语义相似度及义项分布频率进行词义消歧。在Senseval-3数据集上测试,结果表明,该方法能有效实现词义消歧。  相似文献   

8.
屠明萍 《文教资料》2011,(36):121-123
本文采用贝叶斯分类器和条件随机场模型分别在同等规模的训练集和测试集上进行了词义消歧的对比实验。实验结果证明条件随机场模型能从上下文中任意地选择所需要的特征,而且有很强的特征组合能力,而不像贝叶斯分类器那样只对上下文的词形做训练.所以消歧结果是条件随机场模型优于贝叶斯分类器.但是在训练复杂度上.条件随机场要比贝叶斯分类器更为复杂一些。  相似文献   

9.
词类信息对词义的自动识别与标注有重要的意义。现代汉语词典(第五版)为例词标注了词类信息,并分词类立义项,这为通过词类区分词义提供了便利。本文通过对词典中多义项词的词类情况进行分析,探讨了通过词类区分词义所能取得的作用和效果。词类区分词义的作用通过使用词类区分词义和语素义、使用词类缩小词义判断的范围表现出来。词典中,一部分多义词可以通过词类确定唯一义项,一部分词可以通过词类减少义项的数量。本文结合现代汉语词典和词义标注语料数据,对这一问题进行了量化分析,指出了通过词类区分多义词词义所能达到的效果。  相似文献   

10.
汉语词义的模糊现象是客观存在的,本文首先简要描述了汉语词义的模糊现象并对其产生的原因进行了较为深入的分析。作者认为,词义的模糊性是与某些客体自身的模糊性,人的认识能力的局限性以及语言符号本身的表现力有关。  相似文献   

11.
长期以来,人们只谈词本义,或把字本义混同为词本义.本文试从文字学和语言学的角度分析字本义同词本义的联系和区别.字本义是汉字符号的形体形象所表现出来的意义.而书面语中,字是记录语言中的词,这时,它代表的是词本义.字本义研究,属于文字学范畴;词本义研究,属于语言学范畴.字本义的表达方式主要是字的形体形象,词本义的表达方式主要是语音形式.字本义与词本义在结构功能和社会功能两个方面存在差异.字本义与词本义存在着某种一致性,但又不一一对应.掌握字本义同词本义的区别,对语文教学和语言研究是十分重要的.  相似文献   

12.
基于概念层次网络(HNC)理论的语言理解技术,就是4层级数学表示式的激活、扩展、浓缩、转换与存储的过程。HNC语言理解技术包括面向句子分析的句类分析,面向句群分析的语境单元萃取和面向篇章分析的语境生成。本文给出了HNC语言理解技术的整体架构,对几个重要模块的研究进展做了简要说明,并结合搜索引擎和机器翻译等应用,给出HNC语言理解技术的应用情况。  相似文献   

13.
基于HNC的汉语词语知识库是HNC知识库系统的重要组成部分,它以句类知识为核心,从概念、语句和语境三个层面提供汉语理解处理所需的知识。经过10多年的建设,该库已达到80,000多词的规模,成为中文信息处理、汉语教学和汉语本体研究的宝贵资源。  相似文献   

14.
以第二语言习得理论为指导,在介绍了Swain的输出假说后,着重探讨了语言输出在英语学习中对于语感培养的重要性,并提出一些有关输出活动的建议和方法,从而更好地帮助学习者最大限度地达到理想的语言习得效果。  相似文献   

15.
异形词的存在,给书面语的使用增加了负担,给汉语教学、辞书编纂、中文信息处理带来了困难,影响了语言文字交际功能的发挥。异形词的整理规范是汉字规范化工作中的重要一环,关乎如何正确运用语言的实际问题。从学理和语言使用的实际出发,"恢宏、恢弘、恢闳、恢纮"、"自曝、自暴、自爆"这两组异形词在现代汉语中应分别选用"恢宏"、"自曝"作为推荐词形立目并做注解。  相似文献   

16.
汉语"马"词群是汉语词汇系统中非常丰富的一个词群,对其进行造词理据的分析可以更深入地剖析"马"词群的造词法。在这些造词理据中,单纯词使用的是同源性造词理据和模拟性造词理据;合成词表现出来的是直接性理据、相似性理据和相关性理据;熟语中,成语的造词理据是典故性,惯用语的造词理据是相似性,歇后语的造词理据是相似性,谚语的造词理据是相似性和相关性。  相似文献   

17.
分析现有的词表切分法、自动切分算法的不足,通过改进Lucene系统的分词功能,设计了一个基于Lucene的中文数码产品搜索引擎,重点探讨了该搜索引擎的中文分词功能,实验证明本方法对中文词语可以设定正向匹配的字数,从而灵活的有效地进行中文分词。  相似文献   

18.
为扩展分词知识库,提高自动分词能力,本文提出了一种基于自学习机制的汉语自动分词系统。该系统通过对逐词匹配法进行改进,结合分词规则来实现自动分词,并采用统计提取等自学习机制来完善和丰富分词知识库。模拟结果表明该系统能有效获取知识,获得较高的字段切分正确率。  相似文献   

19.
据蔡永贵先生"母文表义"这一理论,剖析了《说文解字》所收录的婴、缨、瘿、瘿、鹦、嘤、樱7个"婴"族字,写成了《试析"婴"及〈说文解字〉中的"婴"族字》一文,发表在《巢湖学院学报》2008年第1期上。在此基础上,本文补析、论证《汉语大字典》所收录的《说文解字》以外的璎、巊、撄、孾、孆、蠳、瀴等22个"婴"族字,论证它们是以本义"妇女戴的颈饰"或特定引申义"环绕、缠绕(于颈)"、"小、弱"的"婴"为母文,加上若干表示具体事类的偏旁如"玉"、"山"、"手"、"子"、"女"、"虫"、"水"等为外部标志而孳乳分化出来的"母文外化字",并把这些"婴"族字与母文的关系用表示意于文末。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号