首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

2.
用JAVA+XML实现网站全文检索   总被引:2,自引:0,他引:2  
介绍了用JAVA和XML实现网站站内全文检索的实现过程,即用java编写索引工具,对WEB文档进行索引,索引结果写入XML文档;用Servlet和JDOM实现读取和查询XML文档,并在客户返回查询结果。  相似文献   

3.
彭哲 《图书情报工作》2008,52(6):110-110
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。  相似文献   

4.
本文阐述电子文件全文检索的背景及意义,接着分析应用Lucene建立全文检索系统具备的优势,最后应用Lucene建立电子文件全文检索系统。  相似文献   

5.
Lucene全文检索的应用及检索效率测试研究   总被引:1,自引:0,他引:1  
使用Lucene设计一个全文检索系统,系统由三大功能模块组成:索引模块、检索模块和存储模块.第二部分着重分析PDF数据转换,XML文档设计,索引的分词、建立及效率等技术难点,并对中文分词分析器、索引文件膨胀率、索引影响因子及检索系统并对检索响应时间进行测试.应关注XML数据库的安全性.  相似文献   

6.
基于Lucene的Web站点站内全文检索系统的设计与实现   总被引:1,自引:0,他引:1  
曹强 《图书情报工作》2007,51(9):124-126,144
设计一个基于开源检索工具包Lucene的Web站点站内全文检索系统,详述系统的设计思路与体系架构,并对中英文分词和添加文档索引等关键技术给出具体代码和实现步骤;最后对该系统进行简单的性能测试并与通用搜索引擎的检索结果进行查全率和查准率方面的比较。  相似文献   

7.
本文分析了<申报>的学术价值和数字化的必要性,介绍了Lucene检索系统的优势和结构,针对<申报>的全文检索需求,提出了基于Lucene的全文检索方案并介绍了实现改方案的关键技术.  相似文献   

8.
针对当前网络环境下专业化学科信息服务需求的不断提高,简要介绍开源全文检索软件Lucene的特点,基于该软件设计实现学科信息服务平台的索引模块和检索模块,并就全文检索的性能与通用关系型数据库进行对比分析。对比结果表明,Lucene开源软件可有效提高学科信息服务平台的检索能力。  相似文献   

9.
对开源全文检索引擎Lucene的系统架构、索引与检索过程、语言分析器进行分析的基础上,针对其对中文只能进行单字切分、双字切分的不足,二次开发基于Lucene中英文语言分析器ZH_CNAnalyzer,并给出一个调用此分析器建立索引与检索的实例。  相似文献   

10.
一种基于Lucene检索引擎的全文数据库的研究与实现   总被引:15,自引:0,他引:15  
在对数据库有关技术分析的基础上,分析对比了全文数据库的特点和关键所在。介绍了实现全文检索的工具包Lucene搜索引擎,并将其引入具体应用,对全文数据库索引和查找技术进行研究,提出并实现了无需后台数据库的全文数据库组织方式,事实表明,索引和查找的时空效率都很高。  相似文献   

11.
基于XML的MARC研究   总被引:4,自引:1,他引:3  
本文分析了机读目录MARC在未来数字化图书馆应用的局限性,并提出了改进方案,以哈尔滨工业大学为例,对其采用的中文机读目录CNMARC格式进行了XML转换的尝试,从而使得MARC书目数据库和Internet上的非书目数据库的集成成为可能.本文的研究对于现有MARC数据在未来数字图书馆中的利用具有重要意义.  相似文献   

12.
彭远方  陈冲 《新闻界》2008,(1):19-21
本文从传播学和社会学的视角,以定性与定量研究相结合的方法,分别从网名、聊天形式、聊天对象、聊天内容、聊天语言等方面对青少年使用QQ的情况进行了分析。  相似文献   

13.
今年"五一",七天长假,神州大地涌动着阵阵旅游热浪. 我凭借着一台电脑、一只调制解调器和一根电话线,"坐地日行八万里",来了一番不寻常的神州兰台网上游,北至东北的吉林,南至海南的琼兰阁,西至甘肃的酒泉,东至东海之滨的上海,造访了全国己开通的10多家档案信息网站,领略了各地兰台网站的不同风采.可谓收获不小,感触颇多.  相似文献   

14.
选取新浪微博为研究对象,探究我国“微博问政”的现状。分别从微博基本信息、使用状况、问政互动状况三个方面对新浪微博的624个政务微博进行跟踪考察,旨在对“微博问政”进行基于数据的、全局性的描述分析,探讨“微博问政”的广度、深度和效度,指出我国当前“微博问政”存在的问题与发展方向。  相似文献   

15.
Web 信息检索(Information Retrieval)技术研究是应用文本检索研究的成果,它结合Web图论的思想,研究Web上的信息检索,是行之有效的Web知识发现的途径。传统HITS方法所获得的信息精确度相当低,而PageRank作为一通用的搜索方法,不能够应用于特定主题的信息获取。在充分分析了PageRank、HITS等现有算法和Web文档的相似度计算方法的基础上,提出了Web上查询特定主题相关信息发现的RG-HITS算法。它结合了Web超链接、网页知识表示的信息相关度以及HITS方法来搜索Web上特定主题的相关知识。  相似文献   

16.
国外图书馆知识管理研究概述   总被引:1,自引:0,他引:1  
知识管理在图书馆的研究已经进入一个发展期,为此需要对国内外相关研究进行全面与深入地调查和研究  相似文献   

17.
日前,社交媒体蓬勃发展,其在带来网络变革的同时,也深刻地影响着档案工作。本文通过列举社交媒体在档案工作中的应用案例,剖析了社交媒体对档案工作的影响,借以反思社交媒体时代档案工作的机遇和挑战并指出了相关应对策略。  相似文献   

18.
信息服务市场中用户存在需求,因此给数字图书馆开展电子商务带来了市场机遇.文章对广东省数字图书馆开展电子商务服务的运作模式进行阐述,认识到利用数字图书馆开展电子商务是发展的必然趋势,分析了数字图书馆推进电子商务面临的主要问题及障碍,最后提出了实现目标的对策和建议.  相似文献   

19.
宋曙光 《北京档案》1999,(11):18-19
一、方法和步骤 档案工作为农业农村建设服务,离不开规范的基础管理.为了全面了解和掌握我区农业农村档案工作状况,1996年我们对全区农业农村档案现状进行了调查了解,全区28个乡镇、463个村、500多个重点乡村企业、40多个农业科技事业单位,其档案工作几乎等于零.针对这种现状,我们把基础建设放在首位.主要采取以下方法:  相似文献   

20.
基于Ontology的文档过滤研究   总被引:2,自引:0,他引:2  
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号