首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 198 毫秒
1.
一种新的搜索引擎探讨   总被引:1,自引:0,他引:1  
罗三定  廖程锋 《情报学报》2004,23(4):428-432
传统的搜索引擎都不具备理解文档内容的能力 ,导致查准率普遍不高。本文提出一种采用RDF和信息提取技术的新的搜索引擎。该引擎采用信息提取技术自动获取和生成网络资源的元数据 ,由RDF描述并携带在互联网上传输、交换 ,智能代理负责收集、处理该元数据信息并向用户提供检索服务。由于计算机可以理解RDF携带的元数据的含义 ,因此可以做到基于内容的概念检索。本文在分析各种技术背景的基础上 ,给出了这种搜索模型的结构图 ,阐述了该系统的原理、优点 ,并给出了部分模块的设计  相似文献   

2.
黄倩 《情报学报》2005,24(6):713-717
Internet的发展使互联网成为一个巨大的信息库,但是信息的获取质量却停滞不前。传统的搜索引擎大都基于关键字机械匹配,因而不具备理解文档内容的能力,导致查询效率普遍不高。由于计算机可以理解RDF描述和携带的元数据的含义,因此可以做到基于内容的精确检索。为此,本文提出一种基于RDF的科技论文搜索引擎的设计与实现方案。该方案包括含词汇集设计、RDF描述生成工具、运行于服务器端的RDF描述信息收集和解析程序、基于词汇集的查询四个模块。查询结果为搜索网页的元数据显示,从而使用户对查询结果有准确的了解,可大大提高用户的搜索效率。  相似文献   

3.
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数 据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。  相似文献   

4.
袁红  乔国慧 《图书情报工作》2014,58(20):112-119
开展基于社会化标签系统、搜索引擎和分类目录3种平台的信息搜寻实验,从相对查全率、相对查准率两个指标的角度比较分析社会化标签系统与其他网络信息搜寻系统的搜寻效率。研究发现,搜索引擎的相对查全率和相对查准率最高,社会化标签系统的搜寻效率也有一定的优势。分类目录比社会化标签的相对查准率低,两者的相对查全率接近。对于某些特定的信息需求,社会化标签系统的搜寻效率甚至超过了搜索引擎。  相似文献   

5.
DC(Dublin Core)是目前国际上最有影响的元数据格式,数字图书馆发展进程中,越来越倾向采用DC实现资源信息的描述。图书馆作为较早采用元数据(MARC)的行业,在管理和描述复杂资源信息中积累了非常丰富的经验。研究DC元数据在图书馆中的应用,除了有利于解决MARC元数据的资源描述局限外,还对其它行业的资源信息描述和管理有很好的借鉴作用。然而,现阶段图书馆DC应用研究多停留在元数据语义层面纠缠,缺乏实用性的元数据编码格式设计,要么采用简单DC,导致资源描述不足;要么随意扩展DC,导致元数据体系膨胀和编码格式不稳定,影响了系统处理效率、增加了前端理解难度。这类型的DC应用实际上是代码性元数据MARC的语义对照转换,没有质的改变。本文分析了数字图书馆中常见资源特点和描述需求,结合DC元数据应用原则,设计了一套稳定的、通用的元数据编码格式,从而利用DC元数据实现了不同类型和载体格式资源的灵活描述,有助于资源描述深度和广度的拓展。  相似文献   

6.
基于用户信息需求的元搜索引擎的构建   总被引:5,自引:0,他引:5  
韩毅 《图书情报工作》2005,49(1):125-127
针对当前网络搜索引擎未能较多地关注用户需求、查全率与查准率不高、彼此间不兼容的缺陷,提出建立基于用户需求的元搜索引擎,并分析其基本原理,给出其基本结构,讨论其运行机制和关键技术。指出基于用户需求的元搜索引擎可使网络信息资源在一定程度上结构化,实现网络信息资源的自组织,提高网络信息检索的查全率和查准率.  相似文献   

7.
回溯网络信息组织模式的发展历程,简析历史上曾流行的网络信息组织模式存在的问题。如Archie花费用户较多的时间去检索信息、Gopher搜索信息耗费的时间较长,搜索引擎的查准率仍有待提高等。为此人们提出了元数据——一种提供关于信息资源或数据的结构化的数据,试图借助该方法来提高网络信息组织与检索。  相似文献   

8.
基于领域本体实现全网信息的智能搜索方法研究   总被引:2,自引:2,他引:0  
为了克服基于关键词匹配的传统搜索引擎不能有效处理复杂语义的问题,提出了一种基于领域本体实现面向整个网络空间的信息智能搜索方法.首先研究了支持网络信息搜索的领域本体结构和表示方法;重点研究了基于领域本体对用户的检索关键词进行语义处理技术,并且设计了一个算法提高语义推理效率;探究了自动调用搜索引擎,按照语义处理后的检索表达式完成全网信息搜索的方法.实验证明,本方法在略有提高查准率的同时,显著提高了网络信息搜索的查全率.  相似文献   

9.
为减少元搜索引擎中无效成员搜索引擎返回的大量重复冗余信息、减轻后期结果处理的负担、提高系统的查准率,文章提出一种基于奖励机制的成员搜索引擎调度策略。该策略引入Agent技术,将每个成员搜索引擎Agent对查询的重要程度进行量化管理,选择检索性能最佳的若干成员搜索引擎进行调度。实验结果证明,这种基于奖励机制的成员搜索引擎调度策略在提高查准率、缩短查询时间、减轻元搜索引擎后期的结果处理负担方面,都优于传统的成员搜索引擎调度策略。  相似文献   

10.
面向网络信息资源聚合搜索的细粒度聚合单元元数据研究   总被引:1,自引:0,他引:1  
由于相关信息片段分散分布在海量且复杂多样的网络信息资源中,用户往往需要花费大量时间浏览、查询和收集所需信息。面向聚合搜索的细粒度聚合单元元数据可以深入揭示信息特征及其关联关系,促进知识发现并提升知识服务效率。因此,有必要构建细粒度聚合单元的元数据描述框架。本文以图书情报领域开放获取期刊论文、在线百科、博客等网络信息资源为数据源,采用逻辑结构分析和形式结构分析方法建立聚合单元划分框架,包括篇章层级的标题、著者等外部特征,以及节段、句群、图表单元中的话语意图和语义功能等特征;通过分析聚合单元的属性特征及复用DC、LOM元数据元素,构建描述聚合单元访问信息、物理信息和语义信息的元数据框架;设计检索数据库并采用实验法对聚合单元元数据框架进行验证。实验表明,该元数据框架可支持多类型网络信息资源、各层级细粒度聚合单元的检索,可为细粒度信息聚合与搜索提供理论基础与实践指导。图7。表6。参考文献58。  相似文献   

11.
王树梅  金澎  吴慧中 《情报学报》2003,22(5):557-560
如何对索引词加权是信息检索中的一个关键技术。本文针对搜索引擎检索的对象是Web页面这一特点 ,通过分析HTML标签的修饰功能 ,结合传统的tf idf加权公式 ,对网页进行加权索引。实验证明对于精确匹配 ,在查全率较低时系统的查准率有较大的提高。  相似文献   

12.
XML搜索引擎研究   总被引:1,自引:0,他引:1  
首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。  相似文献   

13.
传统的网络信息检索存在很多缺陷,导致检索效率低下。本文提出了一种基于本体论的个性化网络信息检索的模型。该模型的实现可以在一定程度上缓解Internet网上信息过载的问题,提供用户个性化信息检索服务,提高网络信息检索的准确率。  相似文献   

14.

The research reported here is part of programmatic effort to develop a more deductive and holistic transituational framework for systematically modeling the relationships among six major elements of social interaction. Phase II was designed to confirm the initial model and to ameliorate methodological flaws found in Phase I.  相似文献   

15.
基于语义网的智能搜索引擎在数字图书馆中的应用   总被引:2,自引:1,他引:1  
针对数字图书馆现有搜索引擎检索所出现的检索结果无论是在召回率还是在精确度上都不能令人满意的问题,运用语义网理论和智能搜索引擎相关性理论,指出查全率和查准率不高的原因,并提出一种基于语义网的智能搜索引擎来改善查全率和查准率。  相似文献   

16.
元数据及其格式研究   总被引:7,自引:0,他引:7  
刘源  吴利薇 《图书馆论坛》2002,22(3):63-63,113
从传统元数据的对比角度,论述了元数据(Metadata)的发展。对DC元数据及其格式进行了研究。探讨了在网络环境下DC元数据的应用与发展。  相似文献   

17.
[目的/意义] 研究高校图书馆OPAC中引入分面搜索技术给用户带来怎样的搜索体验。[方法/过程] 主要通过对用户在两种界面下(传统列表界面和基于列表与分面的界面)进行两种搜索任务(已知任务和探寻式任务)时所表现出的行为和喜好进行实验与观察,从搜索时间、搜索结果准确度、用户评价3方面对比分析搜索界面、搜索任务对用户搜索体验的影响。[结果/结论] 通过研究发现:相对于传统列表界面,受试者在使用基于列表与分面的界面时,搜索用时更短、用户评价更高。  相似文献   

18.
对GILS的认识研究   总被引:4,自引:1,他引:3  
对GILS的定义、查询技术及其与DC的异同进行了阐述,并介绍了美国不同流派对GILS的评估.  相似文献   

19.
基于Ontology的面向主题的网络信息采集算法   总被引:3,自引:1,他引:2  
介绍基于内容评价的、基于链接结构评价的和基于巩固学习的三种采集算法的优缺点;介绍一种依据词典构建主题Ontology的方法,该方法有助于提高Ontology的构建速度;最后,在分析传统采集算法的基础上,提出一种新的基于Ontology的面向主题的网页采集算法,并通过试验证明其优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号