首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 218 毫秒
1.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

2.
图像对象特征值的抽取、存储、转换、显现的实现有多种方法,SIMIIRS系统主要采用了数据库方法和XML方法。文章主要讨论了图像资源的XML描述方法、建立图像信息的XML索引文档,检索XML文档以实现图像信息查询与提供。  相似文献   

3.
XML搜索引擎研究   总被引:1,自引:0,他引:1  
首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。  相似文献   

4.
一个基于XML的引文索引模型设计及其实现   总被引:6,自引:1,他引:5  
黄文  耿继秀 《情报学报》2003,22(2):142-147
本文概述了引文索引在科学研究、信息检索和技术开发等方面的独特利用价值 ,结合当今Web上数据表示和数据交换的新标准XML的优势 ,提出一个基于XML标记语言的引文索引模型 ,在此模型的基础上提出引文索引构建、检索和引文分析的实现方法  相似文献   

5.
XML由于具备易解读、标准开放、可扩展、跨平台等优点而被广泛地应用于教学资源库系统的构建,但是使用现有关系数据库来存储与检索XML数据存在先天不足。而SQL SERVER 2005和ASP.NET 2.0对XML的支持提供了增强功能。本文在分析资源库建设标准、系统功能和结构的基础上,提出了基于SQL SERVER 2005和ASP.NET2.0 XML的教育资源库系统的设计方案,并在此基础上讨论了构建、存储、访问、呈现资源所采用的技术和实现方法。  相似文献   

6.
一种基于Native XML的全文检索引擎   总被引:5,自引:0,他引:5  
王弘蔚  肖诗斌 《情报学报》2003,22(5):550-556
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求  相似文献   

7.
作为Internet网络的标准之一,XML文档通常用于文本数据的描述、存储和交换。本文讨论了用XML文档存储图片的技术方案,包括XML文档结构、图片存储、在线提交、下载和显示,描述了各个功能步骤的技术要点,并给出了基于ASP.NET的程序代码。本文探讨的基于纯XML文档和ASP.NET的图片管理技术具有无数据库驱动、易于实现等特点。  相似文献   

8.
用JAVA+XML实现网站全文检索   总被引:2,自引:0,他引:2  
介绍了用JAVA和XML实现网站站内全文检索的实现过程,即用java编写索引工具,对WEB文档进行索引,索引结果写入XML文档;用Servlet和JDOM实现读取和查询XML文档,并在客户返回查询结果。  相似文献   

9.
指出传统信息检索技术对XML文档的处理,没有考虑其结构信息,描述粒度不够细致,故不能充分挖掘XML文档的表达能力;认为采用元素索引、属性索引和结构索引来记录XML文档的结构信息,可在细粒度上记载XML文档的结构,从而深层次地挖掘XML文档的表达能力。  相似文献   

10.
基于OKAPI的XML信息检索实现研究   总被引:3,自引:1,他引:3  
OKAPI能实现强大的自由文本检索与评价功能,但要实现基于XML的信息检索,却要做适当改造。改造时,一方面尽量不破坏原有系统的体系结构,又要能实现对XML文档的索引、查询和表示。为此,必须完成面向XML的文档预处理和索引、面向XML的文档检索及检索模型的选择。图3。公式3。参考文献10。  相似文献   

11.
In this paper we evaluate the application of data fusion or meta-search methods, combining different algorithms and XML elements, to content-oriented retrieval of XML structured data. The primary approach is the combination of a probabilistic methods using Logistic regression and the Okapi BM-25 algorithm for estimation of document relevance or XML element relevance, in conjunction with Boolean approaches for some query elements. In the evaluation we use the INEX XML test collection to examine the relative performance of individual algorithms and elements and compare these to the performance of the data fusion approaches.  相似文献   

12.
基于加权XML模型的个性化产品推荐方法   总被引:1,自引:0,他引:1  
提出一种基于加权XML数据结构的用户兴趣模型构建方法,对于其中的每个XML节点都增加了表达用户个性化信息的权值,并据此设计一种对加权XML模型进行相似度比较的算法。最后,详述基于此用户兴趣模式的个性化产品推荐系统的实现方法。  相似文献   

13.
In this paper, a novel neighborhood based document smoothing model for information retrieval has been proposed. Lexical association between terms is used to provide a context sensitive indexing weight to the document terms, i.e. the term weights are redistributed based on the lexical association with the context words. A generalized retrieval framework has been presented and it has been shown that the vector space model (VSM), divergence from randomness (DFR), Okapi Best Matching 25 (BM25) and the language model (LM) based retrieval frameworks are special cases of this generalized framework. Being proposed in the generalized retrieval framework, the neighborhood based document smoothing model is applicable to all the indexing models that use the term-document frequency scheme. The proposed smoothing model is as efficient as the baseline retrieval frameworks at runtime. Experiments over the TREC datasets show that the neighborhood based document smoothing model consistently improves the retrieval performance of VSM, DFR, BM25 and LM and the improvements are statistically significant.  相似文献   

14.
基于RDBMS的XML数据存储方法有多种,本文认为它们大体上可分为两类。第一类方法是根据XML文档数据的物理结构设计关系模式,第二类方法是根据XML文档数据的逻辑结构设计关系模式,即根据XML的结构定义(DTD或XML Schema)来设计关系表,第一类方法还可分为基于边的存储和基于结点的存储。本文将结合XML文档实例对上述方法进行分析和探讨。  相似文献   

15.
基于受控词表互操作的集成词库构建研究   总被引:2,自引:0,他引:2  
目前,国内外信息领域都在致力于受控词表的互操作研究.本文以教育类数据为例,通过对检索语言互操作技术的研究,借鉴国内外实现不同受控词表之间互操作的经验和方法,建立一个以<中分表>为核心的兼容体系,即建立一个可以不断扩充的集成词库.为了便于浏览和使用词库数据,采用单机模式、XML格式及本体构建工具对词库兼容数据进行可视化显示,进而为用户提供各种服务.  相似文献   

16.
数字资源管理系统的研究、设计与实现   总被引:1,自引:0,他引:1  
设计研发了一套基于DC和XML的数字资源建设基础系统平台。系统支持对文本、图像、音频和视频等多媒体信息的数字化采集、加工、著录、存储、组织和发布等功能。本文从系统技术体系结构和系统功能模块技术实现等方面予以阐述。  相似文献   

17.
研究将XML文本检索方法应用于长文本环境,并以中文博硕士论文为数据集。对博硕士论文数据集的XML标引、索引、关键词检索和结构化检索分别进行设计和实现,构建一个基于XML的中文博硕士论文检索系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号