首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对PageRank算法查准率和检索效率低的问题,通过增加用户点击率、网页发布时间以及主题内容相关度3个影响因子改进PageRank算法,提高用户查准率;利用MapReduce技术实现改进的PageRank算法,提高网页排序和检索效率;最后通过实验结果数据对比,发现用户检索效率和用户查询准确率有较大提高。  相似文献   

2.
PageRank以某个网页被指向的链接数为基础得到网页的权值,网络搜索引擎以PageRank为基础对网页进行排序.一个完整的搜索引擎由搜索器、索引器、检索器和用户接口构成.用搜索引擎模型可以解决交通线路规划、图书管理等领域中对大量数据需要进行优先级排序的实际问题.  相似文献   

3.
随着可搜索加密技术的发展,用户输入多个查询关键词即可对云服务器中的数据进行检索.但是随着数据量的增加,云服务器的检索效率不断降低,其安全性也难以得到保障.为此,提出一种云存储环境中多关键词加密排序搜索方法.首先,通过对文档的关键词进行聚类,获得特征较集中的索引向量;其次,对索引和查询向量构建标记,根据查询标记的位置过滤...  相似文献   

4.
高校校园网信息资源数量巨大,各信息发布系统的相互独立及多种异构数据源的使用对在校园网范围内进行统一的信息检索设置了障碍。系统着重解决由非结构化文本数据和结构化数据库数据形成的多数据源的集成与整合问题,在Nutch搜索引擎基础上利用Lucene接口对多种源数据建立索引,构建多数据源全文信息检索平台,从而有效地实现全网信息检索并提高检索速度和精度。  相似文献   

5.
网络信息数量的日益增加,对人们从中获取有效信息的能力提出了更高要求。为了更好地响应用户需求,提高信息处理效率并降低人力成本,基于PyQt进行全文搜索引擎平台开发。采用模块化思想设计网络信息采集功能,然后将获取的信息经数据处理后建立索引库,采用PageRank算法对查询响应结果进行排序,实现检索器功能,并通过用户的点击决策,利用神经网络对排序结果进行二次修正。最后,在界面输入查询字符串后,便可快速得到已排序的链接响应,从而能更好地反映用户对检索结果的感兴趣程度,并提供个性化服务。  相似文献   

6.
2014年12月教育网整体运行平稳,未发现严重的安全事件。网页中被添加暗链(链接以隐藏的方式添加在网页源码中,不会直接显示在用户访问的页面内容中,所以叫暗链)是近年来网站被攻击后的一种主要表现形势,暗链主要用来进行非法的SEO(搜索引擎排名优化)。由于暗链只有一条链接且不会直接显示在用户访问的页面中,轻易不会被发现,除非去查看网页源码。最近添加暗链的技术又有了新的变化,攻击者不再是简单地在网页中添加隐藏链接了,而是直接在网页中添加自己需要索引优化的  相似文献   

7.
基于语义Web的关键词相关度的搜索模型,是通过计算搜索关键词在各类教学资源网页主要内容文档块中出现的条件概率,来描述该网页与搜索关键词的相关度,同时利用教学资源网页与资源库课程的归属关系,修正计算的相关度结果。该智能搜索系统能够有效地解决用户搜索资源库时返回过多不相关页面的现状,同时根据媒体、课程与关键词的相关度进行排序,使用户能够从系统返回的近似媒体簇中迅速得到有用信息,从而提高检索准确率。  相似文献   

8.
为了按用户偏好对搜索结果进行排序,提出了一种新的个性化网页排序算法PWPR.PWPR基于按照用户偏好调整网页排序的思想,根据用户兴趣为网页分配初始权值,并建立虚连接,通过测量用户的点击流实现用户喜好的区分.对于具有相似兴趣的用户提交的相似关键词查询,PWPR采用协作过滤方式提高排序精确性.仿真结果及与其他算法的比较证明PWPR算法能自适应地实现个性化排序,并根据用户偏好提供相关查询信息.  相似文献   

9.
数据库检索效率的提高是数据库设计和使用者追求的目标之一。索引的使用可以大大提高数据库的检索效率,保证数据的唯一性。聚簇索引和非聚簇索引是SQL Server 2000中索引的两种组织方式,在不改变索引模型的情况下,通过对两种索引定义和使用等的探讨,结合实践研究了提高索引使用效率的方法和基本的原则。  相似文献   

10.
知识库是一种结构化、易于操作、有组织的知识集群。针对Wikidata这一开放知识库的内容及结构,提出一种构建标签云的方法,对信息进行标签化处理,并将转换得到的标签向量应用于信息检索和页面排序。首先,提取Wikidata中的结构化数据,构建以实体为单位的标签云;然后,将需要检索的文档和用户的检索语句映射为相应的标签,并采用处理向量的相关方法实现网页的排序算法;最后,采用信息检索常用的标准对该算法进行验证。实验结果表明,与传统的基于关键词的搜索方法相比,新算法在一定程度上能够提高页面排序的准确率。  相似文献   

11.
随着网络的飞速发展,网页数量急剧膨胀,近几年来更是以指数级进行增长,搜索引擎面临的挑战越来越严峻,很难从海量的网页中准确快捷地找到符合用户需求的网页。网页分类是解决这个问题的有效手段之一,基于网页主题分类和基于网页体裁分类是网页分类的两大主流,二者有效地提高了搜索引擎的检索效率。网页体裁分类是指按照网页的表现形式及其用途对网页进行分类。介绍了网页体裁的定义,网页体裁分类研究常用的分类特征,并且介绍了几种常用特征筛选方法、分类模型以及分类器的评估方法,为研究者提供了对网页体裁分类的概要性了解。  相似文献   

12.
大规模服务存储结构模型研究中,多级索引模型被证明是非常高效的存储结构,具有稳定、易管理、易维护、低冗余的优势。目前的研究建立在服务调用概率平均分布这一假设之上,然而现实服务调用是不等概率的,这意味着多级索引模型在服务调用的不等概率情况下还不是最优。为提高服务调用不等概率条件下多级索引模型的检索效率,通过分析多级索引模型的检索特性,推导出检索操作的时间复杂度函数。利用函数极值,设计了不等概率条件下键值的优化选择方法。实验结果显示,该方法比随机选键方法提高检索效率15%左右,证明优化选择方法能有效提高服务检索效率。  相似文献   

13.
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.  相似文献   

14.
线性排序算法非常高速,其算法时间复杂度为O(n),但在内存消耗方面的开销很大,并且不支持待排序数组索引输出,改进后的算法的输出结果并不是原数组中元素的有序输出,而是输出元素在数组中的索引值;通过与前者对比,理论分析与实验数据均表明,改进后的算法在待排序元素越多的情况下,排序效率越高,而且输出的结果是各元素在数组中的索引。  相似文献   

15.
基于Lucene架构全文搜索引擎具有高效、简易等特点,但经分析研究基于lucene架构的搜索得分排序算法存在不足,提出了结合词项位置、文档浏览量、更新时间等因素的AHP二次检索公式.设计一种基于B/S的全文搜索系统,实现了对文本的索引、存储与搜索排序.实验证明,改进后的搜索系统为用户提供了个性化搜索服务,更有效地提高信息检索的准确度.  相似文献   

16.
为了提高数字图书馆信息服务的能力,描述了一个基于本体的用户浏览和搜索个性化推荐系统框架.该框架将本体的优点应用于检索周期中,包括提问相关测度、语义化的用户兴趣表达和自动更新、以及个性化的检索结果排序等.在用户访问数字图书馆的交互过程中,可通过本体来构造用户提问和文档内容的匹配机制以实现语义化的内容检索,并可进一步使用本体来构造用户兴趣偏好的概念向量以实现面向用户的个性化推荐反馈.  相似文献   

17.
通过对自动答疑系统的知识库存储及检索方式进行分析,提出了以倒排索引方式对答疑系统知识库文本进行重构,实现了知识库文本预处理和建立倒排索引功能,该系统的建立提高了文本内容的检索的准确率和查全率,使用户获得更好的体验。  相似文献   

18.
文章以布尔逻辑检索方法在中国期刊全文数据库中运用为例,说明现代索引技术改变了传统的检索模式.从工具范围,检索语言等方面为用户提供了数据库信息检索的基本形式,说明了索引技术的发展促进了索引方式现代化的实现,指出现代索引的发展方向。  相似文献   

19.
查询与结果排序是文献检索系统的两个重要指标,直接影响着用户对文献资源的利用率。针对目前文献检索排序策略上存在的不足,从用户检索文献的需求出发,在Skyline算法的基础上提出一种基于Skyline关联度的多目标优化文献检索排序方法,将文献之间的关联程度作为查询算法的主要条件进行检索和排序,从而将有价值的资源挖掘出来。最后,基于CNKI数据库平台对相关文献进行检索,并应用所设计模型对检索结果进行重新排序。结果表明,该方法可有效优化排序结果,将关联度较高的文献信息挖掘出来,满足用户对期望资源的检索要求,提高了文献的利用率,具有一定的参考价值。  相似文献   

20.
在信息系统广泛应用的今天,数据查询的效率越来越受人们关注,以往的顺序查找法查询效率低,很难满足大数据量的查询,本文提出一种基于二叉排序树的动态检索方法,并结合实例,阐述了二叉排序树的构造、平衡、查询等操作,大大提高了检索效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号