首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于两字词簇的汉语快速自动分词算法
引用本文:郭祥昊.基于两字词簇的汉语快速自动分词算法[J].情报学报,1998(5):1.
作者姓名:郭祥昊
作者单位:北京邮电大学人工智能实验室,北方交通大学
摘    要:本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现

关 键 词:自然语言处理  分词算法  切分歧义
修稿时间:1998年1月12日

A Fast Algorithm for Chinese Words Automatic Segment Based on Two letters word family Structure
Guo Xianghao and Zhong Yixin.A Fast Algorithm for Chinese Words Automatic Segment Based on Two letters word family Structure[J].Journal of the China Society for Scientific andTechnical Information,1998(5):1.
Authors:Guo Xianghao and Zhong Yixin
Abstract:
Keywords:natural language processing  Chinese words automatic segmenting  segmenting ambiguousness  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号