首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Lucene的中文分词技术改进
引用本文:刘敏娜.基于Lucene的中文分词技术改进[J].咸阳师范学院学报,2012,27(2):55-57.
作者姓名:刘敏娜
作者单位:咸阳师范学院信息工程学院,陕西咸阳,712000
基金项目:咸阳师范学院科研基金项目(09XSYK206)
摘    要:分析现有的词表切分法、自动切分算法的不足,通过改进Lucene系统的分词功能,设计了一个基于Lucene的中文数码产品搜索引擎,重点探讨了该搜索引擎的中文分词功能,实验证明本方法对中文词语可以设定正向匹配的字数,从而灵活的有效地进行中文分词。

关 键 词:分词技术  自动切分  词表切分

Improvement of Chinese Word Segmentation Technology Based on Lucene
LIU Min-na.Improvement of Chinese Word Segmentation Technology Based on Lucene[J].Journal of Xianyang Normal University,2012,27(2):55-57.
Authors:LIU Min-na
Institution:LIU Min-na(School of Information & Engineering,Xianyang Normal University,Xianyang 712000,Shaanxi,China)
Abstract:The analysis of existing vocabulary segmentation,defect of automatic segmentation algorithm,through the improvement of Lucene system word function,design of a Lucene based Chinese search engine digital products,focus on the search engine of Chinese word segmentation.The experiment proved that this method for Chinese words can be set to match the number of words,and flexible word segmentation.
Keywords:word segmentation Technology  automatic segmentation  word segmentation
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号