首页 | 本学科首页   官方微博 | 高级检索  
     

基于Lucene中英文语言分析器的设计与实现
引用本文:马凤娟,吴鹏飞. 基于Lucene中英文语言分析器的设计与实现[J]. 图书情报工作, 2009, 53(15): 118-121
作者姓名:马凤娟  吴鹏飞
作者单位:1.石家庄经济学院人文与社科学院;2石家庄学院图书馆
基金项目:石家庄学院社会科学基金重点项目;校级
摘    要:分析Lucene的语言分析器结构,针对其只能进行中文单字、双字切分的不足,采用基于词典的正向最大匹配分词算法,设计并实现基于Lucene的中英文语言分析器ZH_CNAnalyzer,实验结果表明其能够对中英文文档进行高效索引,满足实际应用的需要。

关 键 词:搜索引擎  Lucene  中英文分词  正向最大匹配法  语言分析器  
收稿时间:2009-01-12
修稿时间:2009-04-06

Design and Implementation of Chinese and English Language Analyzer Based on Lucene
Ma Fengjuan,Wu Pengfei. Design and Implementation of Chinese and English Language Analyzer Based on Lucene[J]. Library and Information Service, 2009, 53(15): 118-121
Authors:Ma Fengjuan  Wu Pengfei
Affiliation:Library of Shijiazhuang University,
Abstract:This paper introduces the structure of analysis in Lucene,designs and implements the chinese and english language ZH_CNAnalyzer which uses forwards maximum match algorithm for  the disadvantage of one-word and two-words segmentation. It can meet the needs of practical application that can index the documents consist of chinese and english words efficiently.
Keywords:Search engine  Lucene  Segmentation  MM  ZH_CNAnalyzer
本文献已被 万方数据 等数据库收录!
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号