首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.  相似文献   

2.
介绍了搜索引擎和Web结构挖掘的相关知识,重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基础上提出了改进的PageRank算法,通过实验证明,改进后的算法可以使搜索引擎的性能得到极大的提高。  相似文献   

3.
基于结构挖掘和使用挖掘的Web挖掘算法研究   总被引:1,自引:0,他引:1  
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

4.
互联网的迅速发展,搜索引擎也引起了更多人的关注,但主题搜索引擎发展还不够成熟,在国内,它的研究正处于发展阶段,发展缓慢、数量少,用户还不满意.本文提出了一种基于主题预分类的PageRank算法,与传统PageRank算法比较,经验证,该方法在一定的主题下可以提高系统的查准率.  相似文献   

5.
PageRank算法是Google商业应用的关键技术之一。探讨PageRank算法的原理、优缺点,基于连接本身的属性特点,赋予链接不同的权重,提出基于链接本身属性的算法改进思想。数据验证表明,改进的算法可以使得重要的网页排名提前,改进搜索结果。  相似文献   

6.
PageRank算法是目前被广泛应用的一种度量网页重要性的方法,它根据网页之间的链接结构来给每个网页打分,本文剖析了Google的关键技术——PageRank算法,并主要从线性方程组的角度求解PageRank问题.  相似文献   

7.
提出了一种基于Lucene评分机制的PageRank改进算法,实现两者之间算法的有效互补,并利用Lucene框架搭建一个校园网搜索引擎,用以验证新算法的特性.  相似文献   

8.
搜索引擎是互联网资源搜索的入口,搜索的快捷性、准确性是搜索引擎的核心竞争力,如何提高竞争力是业内企业的工作重点。已有的搜索引擎算法中,最具代表性的就是PageRank算法,针对该算法的改进方法也有很多,但效果并不很理想。分析了已有PageRank改进方法的不足,立足于用户搜索行为信息挖掘,采用时序关联分析方法,将关联比例作为权值加入到PageRank计算公式中,改变平均分配权威值的计算方法,从而得到了改进的PageRank算法——TCPR算法,使得搜索排序结果更符合用户的信息需求。  相似文献   

9.
自PageRank提出以来,就引起了学界广泛关注。在概述PageRank算法的基础上,从Topic-RelatedPageR-ank﹑时间维加权PageRank和科研学术网络中加权PageRank这3个方面对加权PageRank算法进行了综述和评价。  相似文献   

10.
针对PageRank算法查准率和检索效率低的问题,通过增加用户点击率、网页发布时间以及主题内容相关度3个影响因子改进PageRank算法,提高用户查准率;利用MapReduce技术实现改进的PageRank算法,提高网页排序和检索效率;最后通过实验结果数据对比,发现用户检索效率和用户查询准确率有较大提高。  相似文献   

11.
ASP在网页制作中的应用   总被引:2,自引:0,他引:2  
ASP是交互式WEB页面,WEB数据库应用的重要技术,本文好介绍了ASP及组件,并用ASP制作了网页计数器,留言簿和数据库查询等具体应用。  相似文献   

12.
网页设计需要考虑到人的视觉加工特点,尤其是人的视觉搜索特点。浏览者对网页信息的获取取决于人的视觉搜索特点及影响因素。对视觉搜索的影响因素进行了分析,并针对每个影响因素为网页设计提供了一些相应的建议。  相似文献   

13.
探讨了Windows中的异步编程技术及异步调用Web服务的技术。结合在Windows窗体中开发网页搜索应用程序的例子,对多线程技术和如何使用异步编程中的异步委托及回调技术进行了研究。通过使用多线程及异步编程技术,实现了Windows窗体中网页搜索的异步编程,使应用程序在执行搜索时能快速响应用户操作,为应用程序提供最佳的响应性能。  相似文献   

14.
在资源越来越丰富的校园网上高效地搜索信息,Web搜索引擎服务是必不可少的。本文介绍了搜索引擎的一般架构体系和Lucenr一款使用Java语言编写的全文搜索引擎开发工具包;然后结合MVC框架和JSP+Servlet+JavaBean技术将Lucene引入具体实践,实现并提供了一个校园网信息搜索平台。  相似文献   

15.
分析了当前网站存在的安全问题,研究了一种高效、安全的网站防篡改技术,结合当前先进的B/S服务架构,设计了一个网页防篡改系统模型,并将基于该模型的网页防篡改系统应用于校园网中,从实验测试结果显示,该解决方案可以实现实时智能恢复网页的功能,从而有效防止了网页被恶意修改,在实际应用中具有很高的应用价值.  相似文献   

16.
如何从Web中找到与用户查询主题相关的权威页面,是Web结构挖掘的一个重要研究方向。将粗糙集理论应用于此,设计了Web数据模型,并给出了基于粗糙集的Web结构挖掘方法的具体实现流程。  相似文献   

17.
在资源越来越丰富的校园网上高效地搜索信息,Web搜索引擎服务是必不可少的。本文介绍了搜索引擎的一般架构体系和Lucene——一款使用Java语言编写的全文搜索引擎开发工具包;然后结合MVC框架和JSP Servlet JavaBean技术将Lucene引入具体实践,实现并提供了一个校园网信息搜索平台。  相似文献   

18.
针对粒子群算法应用于机器人目标搜索过程中存在的早熟现象,提出一种基于改进粒子群算法和模拟退火算法相结合的目标搜索新方法,以提高算法的全局搜索能力。为解决通讯距离有限、机器人无法与基站进行信息交互和不能实时追踪动态目标等问题,引入通讯功能。算法中机器人与基站有两种通讯方式,一种是基站跟随最优机器人移动的通讯方式,另一种是在前者基础上将机器人按一定比例分为通讯机器人和搜索机器人的通讯方式,由通讯机器人负责搜索机器人与基站之间的通讯。两种通讯方式下机器人都采用动态多目标搜索策略搜索动态多目标。在考虑通讯距离的情况下,经过仿真测试,与传统的通讯粒子群算法相比,提出的改进通讯粒子群算法能更加有效地追踪动态目标。  相似文献   

19.
Jigsaw是W3C论坛的一个用Java语言实现的增强型Web服务器平台。它提供了HTTP方式的Proxy服务。通过对Jigsaw资源的配置不仅可以让Jigsaw成为一个代理服务器,而且还可以使代理服务器通过用户添加的动态扩展模块来实现附加功能。利用Jigsaw,将用户定义的Filter资源绑定在Frame上,在不改变原网页的结构的情况下,实现加载网页的功能,使得Jigsaw的适应范围更广,也更灵活。  相似文献   

20.
在分析网络有向图的总体结构以及导航页面、目标页面和网络功能的基础上,研究了结构挖掘算法。针对Hub页面的多主题性、无关页面和无关链接等对HITS算法有较大影响的问题,引入了结构改进,提出了HITS算法的改进算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号