面向舆情发现系统的中文语料分词研究 |
| |
引用本文: | 高慧,张涛,王付强,夏彬.面向舆情发现系统的中文语料分词研究[J].教育技术导刊,2015,14(11):54-56. |
| |
作者姓名: | 高慧 张涛 王付强 夏彬 |
| |
作者单位: | 武汉理工大学 信息工程学院,湖北 武汉 430070;新乡学院 网络管理中心,河南 新乡 453003;中华全国供销合作总社 郑州棉麻工程技术设计研究所,河南 郑州 450000 |
| |
摘 要: | 中文自然语言处理在舆情系统信息预处理中起着重要作用。提出一种基于ICTCLAS的中文舆情语料分词方法。它通过采用层叠隐马尔科夫模型将中文分词、词性标注、歧义词处理和未登录词识别进行系统集成,形成整体的系统框架。实验结果表明,该方法能够有效识别网络舆情用语,提高了分词准确率,为进一步发现高校网络舆情奠定了基础。
|
关 键 词: | 舆情系统 语料 中文分词 |
The Segmentation of Chinese Word Corpus in Public Opinion System |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|