基于Lucene的非结构化文档全文检索系统研究与实现 |
| |
引用本文: | 刘东君,李德泉,周勇,周峥嵘.基于Lucene的非结构化文档全文检索系统研究与实现[J].教育技术导刊,2013,12(10):100-102. |
| |
作者姓名: | 刘东君 李德泉 周勇 周峥嵘 |
| |
作者单位: | 中国气象局预报与网络司;中国气象局国家气象信息中心; |
| |
摘 要: | 如何在海量的非结构文档内容中准确、快捷找到自己所需要的信息,是信息检索技术的研究重点。全文检索是现代信息检索技术一个非常重要的分支,是解决非结构化数据检索需求的重要技术手段。以已发布的各类通信业务管理规范的全文检索需求为切入点,设计并实现了适用于国家级气象信息化业务管理的非结构化文档全文检索系统。该系统基于Java技术,并采用Lucene技术框架,对业务规范信息进行了分析和重新数据组织,确保良好的检索时效与准确率。系统应用后能快速应对业务变化,在已有的大量的规定、规范、标准和公文函件中迅速、准确、全面地查找有关资料信息,帮助用户准确把握气象信息化发展脉络。
|
关 键 词: | 非结构化文档 全文检索 Lucene 索引文件 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|