融合句法特征的汉-老双语词语对齐算法研究 |
| |
引用本文: | 李思卓,周兰江,周枫,郭剑毅.融合句法特征的汉-老双语词语对齐算法研究[J].教育技术导刊,2018,17(4):9-12. |
| |
作者姓名: | 李思卓 周兰江 周枫 郭剑毅 |
| |
作者单位: | 昆明理工大学 信息工程与自动化学院 智能信息处理重点实验室,云南 昆明 650500 |
| |
摘 要: | 词语对齐技术一直是自然语言处理的基础问题。为实现汉―老双语自动词对齐,首先对老挝语存在的修饰词与中心词顺序倒置、结构和位置上的差异性等特征进行了分析,通过分析筛选出一些汉―老双语特征并将这些特征融合,对其构建特征函数,以最小错误率算法为条件,在对数线性模型框架下训练模型参数,将IBM3模型作为基础比较模型,通过逐步添加特征函数从而实现与基础模型的对比。实验证明,该方法可有效提高汉-老双语词对齐质量。
|
关 键 词: | 汉―老双语词对齐 特征函数 最小错误率算法 对数线性模型 IBM3模型 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|