首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
讨论了一种运用于搜索引擎中的多文档自动摘要技术。传统搜索引擎返回结果繁杂,常用的解决方案是使用聚类技术将内容相似的网页集合归类,然而聚类后的结果数目庞大,依然无法体现该类的主题。提出一种新的基于文本关系图的多文档自动摘要技术,对每类返回结果依主题思想自动提取多文档摘要,提高搜索引擎使用效率。分析了该系统的结构和算法,评价了实验结果,指出了未来的研究方向。  相似文献   

2.
本文认为在网络世界将会出现9种新型的搜索引擎,它们分别是零次文献搜索引擎、潜在文献搜索引擎、知识发现搜索引擎、大型元搜索聚类引擎、专业学术型聚类引擎、学术趋势搜索引擎、概念类比联想搜索引擎、解疑答难型搜索引擎和教学研究平台搜索引擎。  相似文献   

3.
翁勍力  施水才  赵捧未 《情报杂志》2007,26(9):114-116,119
针对目前搜索引擎返回结果的海量性和无结构性,构建一个基于元搜索的聚类挖掘引擎,旨在利用元搜索引擎返回的结果,提高搜索结果聚类效率,快速有效地为用户提供一个搜索结果结构视图,从而进行进一步的知识发现。介绍了搜索引擎和挖掘引擎的主要功能及差别,应用向量空间模型对元搜索结果进行处理。介绍当前主要的聚类算法-K—means划分法和层次凝聚聚类法,并在此基础上提出基于元搜索结果将两种聚类算法相结合的聚类方法。  相似文献   

4.
为中文搜索引擎返回结果的每一条记录构建一种修改的PAT-tree结构,为整个返回结果集构建修改的整体PAT-tree结构.通过计算PAT-tree中有效节点代表短语的排序权值函数,提取基本聚类.使用与STC框架相似的聚类算法得出最后的聚类.实验表明该算法能很好地完成中文搜索引擎结果的聚类.  相似文献   

5.
介绍了个性化元搜索引擎检索结果的显示方式,包括自动聚类、主题分和网站地图等;并结合被称为下一代搜索引擎的Grokker,介绍了当前元搜索引擎的实践。  相似文献   

6.
利用分类法和主题法改善搜索引擎的性能   总被引:6,自引:0,他引:6  
苏瑞竹  吴英姿 《情报科学》2001,19(11):1170-1175
本文对Internet上的检索工具搜索引擎的工作机理和性能进行了全方位的探讨,指出了常见搜索引擎信息检索缺点。同时还指出了Meta搜索引擎、智能搜索引擎和代理搜索引擎虽然提高了网络信息检索的质量,但由于分类体系不统一,类目划分标准模糊,因而仍然未能从根本上改变搜索引擎主要以关键词(自然语言)作为检索入口的现状,不能实现分类检索与主题检索的一体化。要实现搜索引擎信息检索的突破,笔者认为有必要运用情报检索语言的理论和方法来完善因特网搜索引擎的性能,实现分类、主题一体化的检索机制,克服分类检索语言单纯以学科聚类、主题语言单纯以事物聚类的局限性。  相似文献   

7.
李旗 《现代情报》2004,24(2):200-202,205
搜索引擎检索结果的文档列表通常过于庞大,给用户查找带来极大不便。作者在当前搜索引擎的工作机制基础之上,引入了智能代理知识库技术,加强了用户与系统的交互性,并自动对检索结果进行文档聚类,以一种导航的方式方便用户快速找到相关的文档。  相似文献   

8.
信息检索的新方法——检索结果自动聚类   总被引:1,自引:1,他引:1  
用户使用搜索引擎查找资料经常会面对着成千上万条的检索结果,这样就很容易忽略掉他们所要查找的信息.现有搜索引擎的主要缺陷是没有对检索结果分类和按人们查询习惯来进行再组织,检索结果自动聚类法——Vivisimo能很好地解决这个问题.本文着重介绍了Vivisimo的工作原理,与其他类似技术的区别以及应用实例.  相似文献   

9.
一种大规模中文搜索日志的层次聚类方法   总被引:1,自引:0,他引:1  
孙锐  金澎 《科技通报》2012,28(8):83-85
提出一种层次聚类算法,旨在对搜索引擎的查询日志数据进行聚类分析。算法基于搜狗实验室公开的查询日志数据,通过3次划分完成查询文本聚类,每一次划分实现不同程度的降维。相似度参数可根据不同的聚类需求调整,算法可扩展性强。实验结果为查询推荐、相关性排序等提供了有力的依据。  相似文献   

10.
唐详 《情报杂志》2005,24(4):58-60
进行了一种面向特定领域主题搜索的实践——聚焦式Web Crawler。分析了搜索引擎和聚类算法的一般工作原理,并指出其不足。在此基础上,综合两者的优点形成了聚焦式Web Crawler工具,介绍了该工具的主要技术及实现方式。  相似文献   

11.
网络文本数据搜索引擎与搜索技术   总被引:3,自引:0,他引:3  
This paper describes the functions, characteristics and operating principles of search engines based on Web text, and the searching and data mining technologies for Web-based text information. Methods of computer-aided text clustering and abstacting are also given. Finally, it gives some guidelines for the assessment of searching quality.  相似文献   

12.
姜恩波  覃琳 《现代情报》2019,39(2):66-72
[目的/意义]搜索引擎作为互联网的核心技术与应用之一,代表了互联网发展的水平。了解当前搜索引擎的发展情况,有利于更好地把握技术前沿动态。[方法/过程]文章首先阐述搜索引擎的发展历史,然后重点介绍基于结构化数据的搜索引擎的原理、应用场景,揭示这一类搜索引擎的特征。[结果/结论]基于数据的搜索引擎是互联网发展过程中的必然结果,也是互联网发展的一个亮点。搜索引擎会继续将互联网的精英技术和理念收揽其中,在人们的学习、生活中发挥更加突出的作用。  相似文献   

13.
针对使用搜索引擎采集竞争情报的准确性和相关性不高的缺点,提出利用语义Web挖掘技术挖掘网络信息资源中的深层知识和情报,并构建基于本体的竞争情报采集模型,最后探讨模型的体系结构、关键技术等问题。  相似文献   

14.
一种基于主题和分众分类的信息检索优化方法   总被引:1,自引:0,他引:1  
本文针对目前搜索引擎存在的检索结果缺乏组织导致检准率不高的问题,提出一种基于主题和分众分类的信息检索优化方法.首先对用户检索主题进行获取和表达,然后以社会标签为聚类项,采用向量空间模型实现基于分众分类的文档主题聚类,并将检索结果按相似度和标签"受欢迎度"复合排序,达到提高检索准确率和优化检索的效果.  相似文献   

15.
In this paper, we present a novel clustering algorithm to generate a number of candidate clusters from other web search results. The candidate clusters generate a connective relation among the clusters and the relation is semantic. Moreover, the algorithm also contains the following attractive properties: (1) it can be applied to multilingual web documents, (2) it improves the clustering performance of any search engine, (3) its unsupervised learning can automatically identify potentially relevant knowledge without using any corpus, and (4) clustering results are generated on the fly and fitted into search engines.  相似文献   

16.
搜索引擎中相关性反馈技术   总被引:10,自引:1,他引:10  
As an important component of search engines, the relevance feedback system is very effective for improving the performance of search engines. This paper firstly reviews the history of relevance feedback technology in the past 30 years, then introduces 2 major methods in relevance feedback, i. e. term reweighting and query expansion, and discusses the relevance feedback technologies based on vector space model and statistical ranking model.  相似文献   

17.
网上搜索引擎的几个理论问题   总被引:23,自引:1,他引:22  
李广健  张蕾 《情报科学》1999,17(4):365-368
本文概述了搜索引擎及其作用,搜索引擎的类型、搜索引擎的信息检索模型、建立搜索引擎的关键技术、搜索引擎的评价标准等理论问题并分析了目前搜索引擎的局限性.  相似文献   

18.
文档聚类在Web搜索结果中的应用研究   总被引:1,自引:0,他引:1  
随着互联网的迅猛发展,信息爆炸式增长,产生了信息过载,而在相当程度上,搜索是面临信息过载的唯一选择。但是,现在的搜索引擎缺陷也很明显:一是搜索结果数量庞大;二是搜索结果的线性排列。该文提出采用文档聚类的方法组织搜索引擎的结果,从一定程度上解决了上面的问题。  相似文献   

19.
Comparing rankings of search results on the Web   总被引:1,自引:0,他引:1  
The Web has become an information source for professional data gathering. Because of the vast amounts of information on almost all topics, one cannot systematically go over the whole set of results, and therefore must rely on the ordering of the results by the search engine. It is well known that search engines on the Web have low overlap in terms of coverage. In this study we measure how similar are the rankings of search engines on the overlapping results.We compare rankings of results for identical queries retrieved from several search engines. The method is based only on the set of URLs that appear in the answer sets of the engines being compared. For comparing the similarity of rankings of two search engines, the Spearman correlation coefficient is computed. When comparing more than two sets Kendall’s W is used. These are well-known measures and the statistical significance of the results can be computed. The methods are demonstrated on a set of 15 queries that were submitted to four large Web search engines. The findings indicate that the large public search engines on the Web employ considerably different ranking algorithms.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号