首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对自动词对齐工具Giza++只允许源语言到目标语言的一对多映射,并生成了很多不对称的对齐,进而直接影响到词对齐的质量和准确性这一缺陷,文章通过研究发现,基于不同预处理机制的词对齐有着不同的系统上可见优势,相对于采用单一预处理机制,机器学习算法可以从基于多预处理机制的词对齐信息中获益。在此基础上,提出基于多预处理机制的多种重映射融合词对齐方法这一设想,并通过实验验证:通过分词预处理形成尽可能含有正确分词方案的方案集,通过对齐预处理获得尽可能多的可靠对齐点,并通过对齐重映射实现对齐的对称化,随后,将对齐重映射的所有相关特征训练一个对齐融合模型,并将这个对齐融合模型作为监督系统,以显著增加词对齐的准确性。  相似文献   

2.
研究选取国内外的6种不同双语对齐工具,通过实验对法律、政治、演讲三种中英双语文本进行对齐比较,分析了不同工具的优缺点。研究发现,整体而言Tmxmall和ABBYY Aligner在对齐的准确率上要优于其他的工具。ABBYY Aligner使用无需网络,更加稳定;Tmxmall需要依靠网络才可以使用,容易受到网络的影响。Trados和Matecat Aligner具有较高的断句准确率,但句段对齐的准确率不甚理想,排名最后。  相似文献   

3.
通过分析c/c++的数据存储问题,阐述为各类数据分配存储空间时所遵循的字节对齐规则,依据字节对齐规则分析各类数据分配存储空间的情况,并对c/c++中使用字节对齐规则的方法进行说明.通过分析可以看出,在c/c++数据存储中使用字节对齐规则,可以有效提高存取效率和存储空间的利用率.  相似文献   

4.
词语对齐技术一直是自然语言处理的基础问题。为实现汉―老双语自动词对齐,首先对老挝语存在的修饰词与中心词顺序倒置、结构和位置上的差异性等特征进行了分析,通过分析筛选出一些汉―老双语特征并将这些特征融合,对其构建特征函数,以最小错误率算法为条件,在对数线性模型框架下训练模型参数,将IBM3模型作为基础比较模型,通过逐步添加特征函数从而实现与基础模型的对比。实验证明,该方法可有效提高汉-老双语词对齐质量。  相似文献   

5.
探讨汉英句级对齐软件设计中两项主要技术,即哈希算法与词典语义映射在对齐中的运用。哈希算法能帮助软件从词典大量的英汉词条语义信息中快速提取所需的对应义,结合语义映射,将需要对齐的句子关键词信息进行语义识别,从而有效提高汉英句子对齐效果。  相似文献   

6.
日语中自动词的使用频率远远高于他动词。由于中日语言表达习惯的不同,很多日语学习者由于受到母语的影响,在进行日语自动词翻译时,往往会出现误译现象。本文拟在阐述日语自动词概念的基础上,探讨日语学习者在进行自动词日汉互译时陷入的翻译困境,寻求翻译对策。  相似文献   

7.
内存对齐对网络通信程序的影响   总被引:1,自引:0,他引:1  
讨论了数据在内存中是如何对齐,结构体数据在内存中是如何存在的,同时内存对齐对不同系统的影响及程序性能影响,以及如何利用内存对齐技术使网络程序间能正确进行数据交换。  相似文献   

8.
在选取合适的汉语语料及其对应翻译的英语语料的基础上,本文主要探讨如何利用软件进行汉、英语料句子层级对齐,旨在提供一种建立平行语料库的方法,为开展汉英平行语料库的相关研究搭建平台。  相似文献   

9.
语料对齐技术研究对语料库建设有着重要的作用。Macken句子层以下语料对齐模式提出了评价对齐工具的一些指标,可以用这些指标来评价现有对齐工具。他的系统用的是句子层以下作为对齐单位,其他研究者多是用句子作为对齐单位。Macken的对齐模式包含三种方法,他最后用加权F值的方法来比较自己的系统和其他系统。  相似文献   

10.
该文对韩礼德提出的同义词库法进行研究,主要内容包括:1)韩礼德的机器翻译观;2)同义词库的编纂原则与体例;3)同义词库法在统计机器翻译中的应用与展望。韩礼德认为,需要从层次和系统两个维度来研究机器翻译,不仅需要考虑词汇语法的对齐,更需要考虑语篇特征,即语境的作用,从而进行更地道的翻译。开展这方面的研究,主要目的是从中提炼出“译后编辑”和“双语对齐”的理论方法,从而促进系统功能语法在计算语言学中的应用和发展。  相似文献   

11.
讨论“向+NP+VP”和“V+向+NP”这两种格式在VP、NP、动词后趋向补语所表示的意义以及介词“向”后的动态助词的差异,并分析造成这些差异的原因。  相似文献   

12.
本文试图从技术水平、易用性、稳定性、发展前景等方面对Visual C 与Delphi/C Builder进行比较分析。  相似文献   

13.
"NP VP 得 NP VP"结构在汉语中有很多,它们大致可以分为两类,第一类为"NPi VP 得 NPj VP",如"张三打得李四站不起来"、"他吓得小孩哭了"等,第二类为"NPi VP 得 (NPi's)NPj VP",如"他兴奋得脸红了"、"他走得脚疼了".  相似文献   

14.
"想+V+N"和"想+N+V"是两个语序不同而语义相近的同义结构,进入这两个结构的动词和名词的语法性质及语义特征都对结构是否成立有着制约作用,同时,这两个结构在逻辑重音、预设内容、信息焦点等方面也存在着差异.  相似文献   

15.
本文首先描写Neg+Wh+VP(没有谁笑)和Wh+Neg+VP(谁也没有笑)两种格式在词类序列、句法构造和论元结构方面的差别,指出它们在逻辑意义上的相同之处及其形成机制(否定存在=全称否定),还从焦点结构和信息结构上分析这两种格式在语气表达方面存在差别的原因(常规焦点的语义否定vs.对比焦点的语用否定)。然后讨论这两种格式中Wh的意义差别及其原因,揭示Wh的周遍性意义的形成机制(Wh在指称上的均质性与也/都的加合功能互动、又受主宾语在定指性上的不对称性的影响)。最后讨论全称否定的排他性保留(如:大家谁也没有笑,只有吴平笑了)和特称容忍(如:吴平没有笑,大家谁也没有笑)现象及其逻辑机制(对于缺省推理的例外声明和冗余重申)。  相似文献   

16.
介绍了面向对象的程序设计语言C++中的虚拟函数及编译器对虚拟函数的处理,分析了C++中编译器的优缺点,并进一步讨论了在C++基类设计中,涉及子函数重写时遇到的几种情况,剖析了虚拟函数在使用中的复杂性,以加深程序设计对虚拟函数及其编译过程的认识,从而能够更好的应用。  相似文献   

17.
本文首先介绍了各个学者对准定语句式"N1+的+N2+V+得+R"所作的不同研究,然后基于收集到的语料提出此类句式是构式语法的多重传承模式所致,即准定语句式"N1+的+N2+V+得+R"是动结构式、拷贝构式和所有格构式共同传承的结果。  相似文献   

18.
"想+V+N"和"想+N+V"是两个语序不同而语义相近的同义结构,进入这两个结构的动词和名词的语法性质及语义特征都对结构是否成立有着制约作用,同时,这两个结构在逻辑重音、预设内容、信息焦点等方面也存在着差异.  相似文献   

19.
"想 V N"和"想 N V"是两个语序不同而语义相近的同义结构,进入这两个结构的动词和名词的语法性质及语义特征都对结构是否成立有着制约作用,同时,这两个结构在逻辑重音、预设内容、信息焦点等方面也存在着差异.  相似文献   

20.
本文就“Ns V 得 NP VP”句的语义关系,从语义结构层次、“NP”与“V”、“NP”与“VP”、“NP”与“V”“VP”、“Ns”与“NP”、“Ns”与“VP”诸方面入手进行了探讨,得出结论:“Ns V 得 NP VP”结构各部分间的语义关系极为复杂,不是一个施受事关系所能解决得了。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号