分词不一致不同成因的自动识别研究 |
| |
引用本文: | 卢俊之.分词不一致不同成因的自动识别研究[J].现代语文,2007(11):87-88. |
| |
作者姓名: | 卢俊之 |
| |
作者单位: | 南京师范大学文学院 |
| |
摘 要: | 一、引言 一个高质量、大规模的分词语料库是中文信息处理的根基.目前机器自动分词的正确率已达到97%左右,但由于校对者受语境干扰和自身语感的差异,时常会出现一个字串的意义、功能都是确定的但给出了不同的切分形式的情况,我们称之为分词变异.
|
关 键 词: | 自动分词 自动识别 成因 中文信息处理 语料库 正确率 校对者 分形 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|