面向未登录领域词切分的中文分词技术研究 |
| |
引用本文: | 蔡荣彦.面向未登录领域词切分的中文分词技术研究[J].信息系统工程,2013(11):133-136. |
| |
作者姓名: | 蔡荣彦 |
| |
作者单位: | 辽宁科技大学理学院 |
| |
摘 要: | 本文通过研究现有中文分词技术的理论和工具,提出一种面向未登录领域词识别的中文自动分词算法。首先,利用已有的中文自然语言处理技术对中文文本进行自动分词,并用一种改良的串频统计方法自动识别出语料中的未登录领域词汇,从而有效提高了中文分词的准确性。
|
关 键 词: | 中文分词 串频统计 未登录词 |
本文献已被 维普 等数据库收录! |
|