首页 | 本学科首页   官方微博 | 高级检索  
     

从ACL-SIGHAN国际分词竞赛看已知词和未登录词识别的平衡问题
引用本文:陈丽江. 从ACL-SIGHAN国际分词竞赛看已知词和未登录词识别的平衡问题[J]. 南京师范大学文学院学报, 2005, 0(1): 184-188
作者姓名:陈丽江
作者单位:南京师范大学,文学院,江苏,南京,210097
摘    要:中分词一直是大规模语料库加工的基础,它需要能够正确识别出语料中的已知词和未登录词,而各种基于规则和统计的方法在识别已知词和未登录词时各有优劣。本试分别从已知词和未登录词识别两个方面,对ACL—SIGHAN第一届国际中分词竞赛中各参赛系统进行比较,指出中分词既需要提高已知词识别的准确率,还要能够较好地预测语料中出现的未登录词,并处理好它们之间的平衡关系。

关 键 词:分词竞赛 已知词 未登录词 平衡性适应性
文章编号:1008-9853(2005)01-185-05
修稿时间:2004-12-17

Looking at the Balance between the Identified IV and OOV from the ACL-SIGHAN International Participle Competition
Chen Lijiang. Looking at the Balance between the Identified IV and OOV from the ACL-SIGHAN International Participle Competition[J]. Journal of Chinese Language and Culture School Nanjing Normal University, 2005, 0(1): 184-188
Authors:Chen Lijiang
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号