基于两字词簇的汉语快速自动分词算法 A Fast Algorithm for Chinese Words Automatic Segment Based on Two letters word family Structure期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于两字词簇的汉语快速自动分词算法

引用本文：	郭祥昊.基于两字词簇的汉语快速自动分词算法[J].情报学报,1998(5):1.

作者姓名：	郭祥昊

作者单位：	北京邮电大学人工智能实验室，北方交通大学

摘要：	本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占７５％的统计规律，提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理，也就是把长词的扫描范围限定在词汇量很小的词簇内，从而不仅提高了分词速度，而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外，本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现
关键词：	自然语言处理分词算法切分歧义
修稿时间：	1998年1月12日
A Fast Algorithm for Chinese Words Automatic Segment Based on Two letters word family Structure

Guo Xianghao and Zhong Yixin.A Fast Algorithm for Chinese Words Automatic Segment Based on Two letters word family Structure[J].Journal of the China Society for Scientific andTechnical Information,1998(5):1.

Authors:	Guo Xianghao and Zhong Yixin

Abstract:

Keywords:	natural language processing Chinese words automatic segmenting segmenting ambiguousness
本文献已被 CNKI 万方数据等数据库收录！