首页 | 本学科首页   官方微博 | 高级检索  
     

基于语料库的汉语复合名词短语自动获取研究
引用本文:王萌,朱虹,徐戈. 基于语料库的汉语复合名词短语自动获取研究[J]. 乐山师范学院学报, 2014, 0(12)
作者姓名:王萌  朱虹  徐戈
作者单位:1. 江南大学 人文学院教育技术系,江苏 无锡,214122
2. 中国标准化研究院,北京,100191
3. 闽江学院 计算机科学系,福建 福州,350108
摘    要:汉语复合名词短语广泛存在于各种文体中,且绝大部分是低频的,这给复合名词短语的自动获取带来了很大的挑战性。文章针对统计指标不能有效获取低频复合名词短语的问题,提出了新的解决方法,将其视作一个分类问题,利用统计指标获取典型的、高频的复合名词短语作为训练数据,抽取多种特征,来帮助发现低频的复合名词短语,实验结果说明该思路是有效的。

关 键 词:复合名词短语  自动获取  SVM  统计指标

A Study of Automatic Acquisition of Chinese Compound Noun Phrases Based on Corpus
WANG Meng,ZHU Hong,XU Ge. A Study of Automatic Acquisition of Chinese Compound Noun Phrases Based on Corpus[J]. Journal of Leshan Teachers College, 2014, 0(12)
Authors:WANG Meng  ZHU Hong  XU Ge
Abstract:
Keywords:Noun Compounds  Automatic Acquisition  SVM  Statistical Indexes
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号