首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 172 毫秒
1.
从信息检索流程对XML检索的研究情况进行综述。主要对XML查询语言、XML索引、XML检索排序方法以及XML检索评价4个方面的研究情况进行评述,并对XML检索研究的一些热点领域进行介绍,最后就需要继续深入研究的问题进行简要说明。  相似文献   

2.
XML检索系统及其比较研究*   总被引:2,自引:0,他引:2  
探讨XML检索与传统信息检索的区别、XML检索的目标与任务以及XML检索系统研究的核心问题,并对现有的几个XML检索系统进行介绍和比较研究。  相似文献   

3.
研究利用XML文本片段和图像的内容特征(颜色)实现图像的检索。基于XML多媒体数字图书馆检索系统平台WHU-XML,对XML文本和图像构建索引,并在此基础上,采用线性归并法,实现基于XML文本片段的图像检索和基于图像内容特征(颜色)检索的结合。研究结果表明,当文本检索权重大于图像内容检索的权重时,检索效果比只采用单一检索方式时好。  相似文献   

4.
针对信息检索角度的XML的结构化检索问题,利用基于倒排文件的方法,使用NEXI作为检索语言,在基于XML的数字图书馆检索实验系统WHU-XML上对其进行实现,并具体分析查询语言的解析方法以及所采用的结构化检索算法。  相似文献   

5.
元素级XML检索模型构建的关键问题与解决方案研究   总被引:2,自引:1,他引:2       下载免费PDF全文
与传统信息检索不同的是XML要实现元素级的检索,其核心是元素级检索模型的构建。而XML文档内上下文元素的相关性、元素之间信息的重复性以及元素大小的不一性等则是构建模型时面临的核心问题。解决办法是:构建基于BM25元素级XML检索模型,构建基于上下文的元素级XML检索模型BM25E,过滤重复元素,进行可检索元素的选择和太小元素的处理。表1。图1。参考文献19。  相似文献   

6.
提出一种基于XQuery语言构建Web应用、实现Web信息检索的新方法:在基于XML数据存储的服务器端,XQuery脚本经Qexo工具包转换成服务器可执行程序,能够响应Web用户的信息检索请求,动态生成HTML页返回给用户。  相似文献   

7.
王福 《贵图学刊》2009,(4):47-48
对数字图书馆统一检索平台的核心问题进行了介绍,在对XML和WebService介绍基础之上提出了基于XML与WebService相结合的数字图书馆同意检索的总体模型,并对如何利用该模型建立统一检索平台进行实证研究。  相似文献   

8.
INEX是当今信息检索领域最重要的国际评测会议之一.文章通过对INEX 2004年至2010年检索评价项目数量、项目类型、项目任务、测试集的变化,以及对IST 2007年至2010年所关注项目,参与INEX评测的机构的分析,了解XML检索领域的发展方向与趋势,以促进我国科研团队在XML语言检索评价领域更加深入的探索和发展.  相似文献   

9.
一种基于Native XML的全文检索引擎   总被引:5,自引:0,他引:5  
王弘蔚  肖诗斌 《情报学报》2003,22(5):550-556
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求  相似文献   

10.
图像对象特征值的抽取、存储、转换、显现的实现有多种方法,SIMIIRS系统主要采用了数据库方法和XML方法。文章主要讨论了图像资源的XML描述方法、建立图像信息的XML索引文档,检索XML文档以实现图像信息查询与提供。  相似文献   

11.
彭哲 《图书情报工作》2008,52(6):110-110
全文检索系统由三大功能模块组成:索引模块、检索模块和存储模块。本文着重分析系统组成和XML数据库的设计、建立倒排索引文件、中文分词等技术难点。同时在此基础之上建立基于Lucene/XML的期刊文献全文检索系统。  相似文献   

12.
作者根据多年的教学经验,采用“问题解决”的教学方法,设计由浅到深的“问题串”,引导学生掌握《中国期刊全文数据库》的检索方法,并能根据课题的不同需要,结合《中国期刊全文数据库》的特点,制定良好的检索策略,掌握《中国期刊全文数据库》的检索技巧。  相似文献   

13.
基于Lucene的Ftp搜索引擎的设计   总被引:2,自引:0,他引:2  
针对当前网络中所使用的基于数据库的Ftp搜索引擎没有标准资源文档且不支持中文分词和动态数据更新的缺陷,提出基于Lucene这个功能强大的全文索引引擎工具包的Ftp搜索引擎的设计方案。此Ftp搜索引擎不仅能够自动生成标准格式的XML资源文档,而且采用基于字典的前向最大匹配中文分词法在Lucene中动态更新全文索引。该设计还能够对检索关键字进行中英文混合分析和检索。  相似文献   

14.
XML信息检索探究   总被引:4,自引:0,他引:4  
廖述梅  万常选  徐升华 《情报学报》2007,381(2):229-234
XML文档是具有层次结构和文本内容的半结构化数据。现有的Web信息检索是基于HTML文档的关键词全文检索,无法胜任XML元素粒度的检索;同时,XML数据库检索实现的是精确查找,检索结果无排序支持。因此,融合信息检索和数据库技术研究XML检索问题成为必然。本文从XML检索的问题域出发,阐述了XML信息检索(XML IR)的国内外研究现状与特点,并分析了目前XML IR的热点和难点问题。  相似文献   

15.
我国四大学位论文库的比较研究   总被引:3,自引:0,他引:3  
通过对万方数据的<中国学位论文全文数据库>(简称CDDBFT)、清华同方的<中国优秀博硕士论文全文数据库>(简称CDMD)、国家科技图书文献中心的<学位论文库>(简称NSTL)、中国高等教育文献保障系统的<高校学位论文库>(简称CALIS)的数据来源、论文提供形式、检索方法、检索结果显示及处理方式、收费标准及服务方式的比较,分析了它们存在的问题.今后的发展方向是:整合学位论文资源,由万方公司建设我国数量最多、质量最好、价格最低的中国学位论文全文数据库;扩大收录范围,除了增补国内所有的学位论文外,兼收香港、澳门、台湾地区的学位论文;设置打印、下载、保存权限以防止滥载、滥引,从而减少抄袭现象.  相似文献   

16.
This study introduces a novel framework for evaluating passage and XML retrieval. The framework focuses on a user’s effort to localize relevant content in a result document. Measuring the effort is based on a system guided reading order of documents. The effort is calculated as the quantity of text the user is expected to browse through. More specifically, this study seeks evaluation metrics for retrieval methods following a specific fetch and browse approach, where in the fetch phase documents are ranked in decreasing order according to their document score, like in document retrieval. In the browse phase, for each retrieved document, a set of non-overlapping passages representing the relevant text within the document is retrieved. In other words, the passages of the document are re-organized, so that the best matching passages are read first in sequential order. We introduce an application scenario motivating the framework, and propose sample metrics based on the framework. These metrics give a basis for the comparison of effectiveness between traditional document retrieval and passage/XML retrieval and illuminate the benefit of passage/XML retrieval.  相似文献   

17.
基于XML的全文检索原型系统的设计与实现*   总被引:1,自引:0,他引:1  
针对当前单位网站搜索引擎存在的索引速度慢、更新不及时、检索效率低等问题,在深入分析和研究Lucene和XML等技术在建立搜索引擎方面优越性能的基础上,构建一个基于XML的全文检索原型系统。该系统以XML作为通用数据接口,以Lucene作为实现平台,能够实现快速及时索引和提高检索效率的目的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号