首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]构建面向分面检索的分面体系和政府开放数据分面检索模型,以优化用户体验.[方法/过程]立足政府开放数据特征进行政府开放数据分面体系构建,在此基础上,构建政府开放数据分面检索模型,并进行原型系统的实现以验证模型的可行性和效果.[结果/结论]通过原型系统实现证实所构建的政府开放数据分面体系能够有效帮助用户进行检...  相似文献   

2.
从分面检索的基本概念与特点出发,对基于集合论、基于轻量级本体、基于形式概念分析的三类分面模型进行分析归纳,对分面分类体系生成、分面排序及搜索结果排序等关键技术的主要研究工作进行综述,并对有代表性分面检索系统进行说明.  相似文献   

3.
基于Sogou实验室提供的查询日志数据和新闻数据,探讨潜在时间意图查询的判断及其相关时间属性识别,构建潜在时间意图查询的检索排序模型。实验结果表明,时间属性识别的准确率为85%,且构建的检索模型能有效提高排序效果。  相似文献   

4.
查询意图研究综述   总被引:1,自引:1,他引:0  
近年来,学界对查询意图进行了广泛探讨,一些重要国际会议如SIGIR,WWW等越来越重视查询意图的相关研究,其研究点主要集中在给定分类体系下的查询意图识别,内容涉及查询意图类目体系构建、特征识别、分类方法以及数据集与评价方法。研究发现当前查询意图研究面临如下问题和挑战:缺乏权威的评测标准,各种分类方法在大规模查询集合上的性能还不确定,有效提取或者获得查询特征的方法仍然值得深入研究,查询意图分类体系的完备性和类别间独立不相关性尚不确定。  相似文献   

5.
从Sogou查询日志中选取样本查询且进行人工标注,通过对标注后新闻查询的分析,提出能用于识别新闻意图的新特征,即查询表达式特征、查询随时间分布特征以及点击结果特征。根据这3个特征,利用决策树分类器实现查询中新闻意图的自动识别,结果发现:①新闻类查询的查询目标主要集中在特定主题信息以及娱乐类信息方面,其查询主题大多为娱乐、政治、体育与经济类信息;②相对非新闻查询,新闻查询具有更可能包含实体、随时间分布波动较大、点击结果之间相似度更高的特点;③本方法对查询中新闻意图的识别效果较好,其宏平均准确率、召回率、F值分别为 0.76、0.73、0、74。  相似文献   

6.
基于AOL查询日志数据集,在不给定查询意图类目体系情况下,尝试利用查询重构来识别用户查询意图。主要探讨如何识别出能表达原查询用户意图的查询重构以及如何对识别的查询意图进行聚类两个问题。人工评测结果表明,该方法能够取得较好的实验效果。  相似文献   

7.
基于内容的图像查询检索   总被引:2,自引:0,他引:2  
一.多媒体信息处理 进入九十年代以来,随着多媒体的推广应用,现代信息处理的对象和方法都有了很大的变化和发展。其中比较显著和重要的一点就是大量的信息(特别是图象信息)得到采集并通过网络进行传输,出现了电子图书馆,会议电视,远程教育等许多新的服务形式和项目。这些都对人们生活的方式节奏和社会结构的发展变化产生了重要的影响。  相似文献   

8.
本文讨论了图书分类法的分面组配因素对分类法兼容性的影响,认为组配程度越高,越有利于实现可靠的兼容,并认为传统的等级体系分类法与组配分类法的完美结合应当成为当代乃至未来一定时期内图书分类法的主要特征。  相似文献   

9.
一种能综合利用多种检索技术优势的数据库检索功能设计   总被引:3,自引:0,他引:3  
首先说明,通过分面分类、后控检索和超链接检索技术的利用,信息检索中分类、主题检索优势难以兼得,采用自然语言又影响查全率,扩检、缩检难以同时方便进行的问题是可以解决的。然后又说明,采用分面分类技术可编制一个分类主题一体化的联机词表,在联机词表的基础上可生成具有各种词间关系的后控词表,由于在后控词表网状词间关系的基础上还可以引入超链接检索技术,因此如上三种技术的综合利用成为可能,一个具有分类、主题检索两方面优势,使用自然语言、又能保障检索质量,并能方便的进行扩检、缩检检索功能设计得以实现。  相似文献   

10.
[目的/意义]了解、分析和识别用户学术搜索时所表达的信息需求是优化查询结果、提高学术搜索引擎用户体验的首要步骤,而用户进行学术搜索时通过查询表达式所表达的用户表意信息需求及潜在信息需求可称之为学术查询意图。本文总结学术查询意图类目体系有助于学术查询意图识别和检索结果页面的呈现。[方法/过程]在A.Broder的查询意图类目体系的基础上,结合百度学术搜索查询日志中查询表达式实例,构建学术查询意图的类目体系。以此为基础,总结不同类别的学术查询意图,并分析不同类别学术查询意图下查询表达式的特点。[结果/结论]学术查询意图主要分为学术文献类、学术实体类、学术探索类、知识问答类和非学术文献类五大类;得出不同类别学术查询意图在学术搜索中的大致比例;给出每类学术查询意图的查询表达式特征、查询情景和查询结果页。  相似文献   

11.
12.
对于搜索引擎返回的结果太多且较少考虑用户个性差异等缺陷,提出根据用户查询意图,实时给予多个主题的搜索建议,帮助用户更准确地描述所需信息,修正查询词与真实意图之间的差距,提高检索效率。同时运用K-means算法,对资源类别的意图特征值相似用户进行聚类,缩小查找目标对象最近邻居的范围,提高搜索建议的实时响应速度。实验结果表明,该方法是可行的。  相似文献   

13.
王晓艳  林昌意 《图书情报工作》2015,59(1):113-118,126
[目的/意义] 通过网页分类提高搜索引擎及内容网站的检索性能,根据查询意图分类更精确地满足用户需求。[方法/过程] 以信息类中文网页为研究对象,采用人工归纳的方法构建信息类查询意图类目体系,提出根据该类目体系对信息类网页进行分类的方法,并通过实验进行验证。[结果/结论] 实验结果表明,所提出的方法具有较强的可行性,有助于精确地满足用户信息需求,提高搜索引擎及内容网站的检索性能。  相似文献   

14.
[目的/意义]实现学术查询意图的自动识别,提高学术搜索引擎的效率。[方法/过程]结合已有查询意图特征和学术搜索特点,从基本信息、特定关键词、实体和出现频率4个层面对查询表达式进行特征构造,运用Naive Bayes、Logistic回归、SVM、Random Forest四种分类算法进行查询意图自动识别的预实验,计算不同方法的准确率、召回率和F值。提出了一种将Logistic回归算法所预测的识别结果扩展到大规模数据集、提取"关键词类"特征的方法构建学术查询意图识别的深度学习两层分类器。[结果/结论]两层分类器的宏平均F1值为0.651,优于其他算法,能够有效平衡不同学术查询意图的类别准确率与召回率效果。两层分类器在学术探索类的效果最好,F1值为0.783。  相似文献   

15.
本文研究了科技文献副主题词的自动抽取问题,并对其在分面检索中的应用进行了探索。为实现副主题词的自动标引,本文提出了以标题作为抽取数据源、基于规则进行抽取的实现方法,并以图情领域文献进行了实验。结果显示,基于规则的抽取方法在召回率和准确率方面表现良好,均超过了90%;但仅以标题作为抽取数据源会导致召回率偏低,仅有49.9%的文献能抽取出副主题词。为探索副主题词在分面检索中的应用,本文以图情领域文献为例构建了原型系统,从使用效果来,副主题词作为独立的检索点价值不大,但和其他检索点配合使用则可以更贴切地表达用户需求,作为分面则能在帮助用户进行探索式检索以及结果筛选方面发挥重要作用。本研究的局限性包括仅采用标题作为副主题词抽取数据源,导致召回率不高;在副主题词抽取时未考虑同时抽取相应的主题词等。  相似文献   

16.
图书分类法以具有学术价值的文献作为处理对象,而报纸资料的价值特点体现在:观点政策参考价值、事料背景参考价值、知识介绍参考价值,地区、人物、形式、学科专业等分类标准同样重要。据此,提出了对这些分类标准采取并行处理的方法编制报纸分面分类法的构想,并讨论了报纸分面分类法的使用方式问题。  相似文献   

17.
吴茜 《图书馆学研究》2021,(2):78-85,77
探索面向学龄前儿童的绘本分面检索系统构建方案,为学龄前儿童对绘本资源进行自主选择和探索发现提供有效途径.分析学龄前儿童认知特点,基于其认知特点进行绘本信息分面体系设计.在此基础上,构建面向学龄前儿童的绘本分面检索系统模型,并以京东自营儿童绘本数据为例,进行原型实现.该方案符合学龄前儿童的认知特点,具备可操作性,有助于帮...  相似文献   

18.
查询分类是近年来信息检索领域的研究热点,并且在很多领域得到了广泛的关注.文章首先介绍了查询分类的概念和一些相关知识,然后主要讨论根据查询的意图进行分类的研究工作,从查询分类的诞生背景、关键技术、所使用的分类方法和评价方法方面进行综述评论,提出了查询意图分类面临的问题和挑战.该文为2008年第七期本期话题<用户查询的理解>的文章之一.  相似文献   

19.
个性化检索是信息检索领域研究的热点。要实现个性化检索必须收集用户兴趣。用户兴趣不能一概而论,针对不同的查询,用户的兴趣应该不同。选取与当前查询相关的检索历史构建查询上下文,通过查询上下文对检索结果进行重新排序。实验证明,个性化检索性能有所提高,提高的因素来自于最临近的几次检索历史,而更长的历史数据会使系统的运行效率下降,同时还会带来嗓音。
  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号