首页 | 本学科首页   官方微博 | 高级检索  
     检索      

主题模型在统计机器翻译中的应用
引用本文:巢佳媛,贡正仙.主题模型在统计机器翻译中的应用[J].中国科技信息,2013(11):99-100.
作者姓名:巢佳媛  贡正仙
作者单位:苏州大学计算机科学与技术学院,215006
基金项目:苏州大学大学生创新训练计划项目
摘    要:在基于短语的统计机器翻译中,短语表是解码器工作的核心部分,它主要包含了源端和目标端短语的翻译概率和词汇互译概率;但传统的短语表数量庞大,并且领域自适应能力差。为了在解码过程中挑选出更高质量的短语对,适当减少内存消耗和缩小解码空间,本文介绍了一个简单易行的基于主题模型的统计机器翻译系统的实现:首先使用LDA工具建立主题模型,然后把主题模型信息嵌入到短语表中,最后为解码器设计一个预处理模块可以使解码器不需要改变就可以在翻译过程中根据主题选择合适的短语对,从而提高了翻译的效率和质量。

关 键 词:统计机器翻译  主题模型  LDA

Research on Topic Model-based SMT
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号