首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于概念的权重PageRank改进算法   总被引:2,自引:0,他引:2  
杨彬  康慕宁 《情报杂志》2006,25(11):70-72
对比了基于链接分析的搜索引擎排序算法PageRank和HITS。针对原有PageRank算法采用的平分页面自身PageRank值的策略,提出了一种按权值分配的改进算法。权值由页面间的概念关联比重和用户的搜索概念确定。  相似文献   

2.
Google的PageRank技术剖析   总被引:39,自引:5,他引:39  
曹军 《情报杂志》2002,21(10):15-18
检索结果排序算法一直是情报检索系统的核心技术之一,在搜索引擎中的地位则更加重要。通过对搜索引警google的关键技术PageRank的深入剖析,分析了其在Google排序系统中的作用,并对其发展所存在的问题进行了探讨。  相似文献   

3.
Web结构挖掘的PageRank算法改进   总被引:2,自引:1,他引:2  
吴春旭  郭磊 《情报杂志》2005,24(10):55-56,58
分析了Web结构挖掘的PageRank和HITS算法,并介绍了一种对PageRank算法的改进。  相似文献   

4.
介绍了SALSA算法的基本原理及算法步骤 ;同时 ,分别将其与PageRank算法及HITS算法从多个方面进行了比较分析。  相似文献   

5.
研究主要针对PageRank只考虑链接关系,而不考虑相关性的缺点进行了一些改进,把Web数据挖掘技术的内容挖掘应用到PageRank算法中,基于超链接文本和内容与主题的相关性,提出了PageRank算法的优化算法,并通过实验仿真,实验结果表明改进后的方法对提高更高相关性的网页的排名是有效的,符合人们的期望。  相似文献   

6.
结合网页内容分析的PageRank算法初探   总被引:1,自引:0,他引:1  
李树青 《情报杂志》2005,24(12):34-35,38
作为一种相当成功的基于超链分析的算法,PageRank算法可以有效地衡量网页重要度权值,然而进一步的研究也表明,这种纯粹依赖于超链分析的算法由于没有考虑到网页内容对网页重要度权值的影响,所以在一定程度上会造成偏差。因此,合理的将两者进行结合,充分利用网页内容特征对PageRank算法进行改进,可以极大的提高这种算法的有效性。  相似文献   

7.
分析了Google的PageRank(PR值)算法原理,详细论述了网站链接的3个主要方面:出站链接、入站链接、站内链接的变化对网站PR值的影响,并提出了通过增加入链、减少出链和避免不必要的内部链接来优化网站链接,以提高PR值,从而为改善网站在搜索引擎中的排名提出了优化策略。  相似文献   

8.
孟瑞玲 《现代情报》2010,30(7):93-96
智能搜索引擎的提出引发了新一轮搜索引擎革命,然而其实现还有一定的困难。以目前非常成熟的PageRank技术为基础进行改进,构建基于个人需要的PageRank算法,可以实现智能搜索引擎所需要的多种个性化功能。目前在大型广域搜索引擎上建立个性化的智能搜索引擎还比较困难,而高校图书馆在信息规模、用户基础和运行条件上都有建立智能搜索引擎的优势。对目前的高校图书馆检索系统进行一定的改进,可以实现智能搜索引擎的个性化功能。  相似文献   

9.
搜索引擎是互联网资源搜索的入口,搜索的快捷性、准确性是搜索引擎的核心竞争力,如何提高竞争力是业内企业的工作重点。已有的搜索引擎算法中,最具代表性的就是PageRank算法,针对该算法的改进方法也有很多,但效果并不很理想。分析了已有PageRank改进方法的不足,立足于用户搜索行为信息挖掘,采用时序关联分析方法,将关联比例作为权值加入到PageRank计算公式中,改变平均分配权威值的计算方法,从而得到了改进的PageRank算法——TCPR算法,使得搜索排序结果更符合用户的信息需求。  相似文献   

10.
GOOGLE搜索引擎PageRank技术的优化   总被引:6,自引:0,他引:6  
阎放  张海涛  朱宏谊 《情报科学》2002,20(12):1333-1335
本文通过研究搜索引擎Google的PageRank技术存在的不足,根据用户在输出结果中的翻页情况和用户点击URL的分布情况的统计分析,提出了PageRank技术优化方案的初步设想。  相似文献   

11.
12.
在网络环境下,HITS算法存在一些不足,易产生主题漂移现象。文章在介绍HITS算法的基础上,结合超链接中的锚文本分析,在原有算法的基础上对其进行了改进。实验证明,改进后的算法有效地提高了信息检索的查准率。  相似文献   

13.
在分析传统期刊影响力评价指标缺陷的基础上,引入一种新的期刊影响力评价指标———基于PageRank算法的期刊影响力权值。首先详细阐述其思想、计算过程和影响因素等,然后以国外图书情报类期刊为例,计算图书情报领域期刊的影响力权值,分析这些期刊的学术影响力,并将其与期刊影响因子、期刊自引率、总被引次数等指标进行对比分析。  相似文献   

14.
自PageRank提出以来,就引起了学界广泛关注。在概述PageRank算法的基础上,从Topic-Related PageR-ank﹑时间维加权PageRank和科研学术网络中加权PageRank这3个方面对加权PageRank算法进行了综述和评价。  相似文献   

15.
16.
Web结构挖掘研究   总被引:13,自引:0,他引:13  
Web上的信息以及用户都在以接近于指数的速度增长 ,到 2 0 0 1年 9月Web服务器已接近 30 0 0万台 ,网络用户数量接近 4亿[1] 。计算机和网络技术的发展 ,为信息传播提供了技术支持 ,使得信息的发布与访问不再受到时间和空间的限制 ,为用户提供了极大的方便。搜索是解决网络信息无序和混乱的一个基本方法 ,同时也使得在因特网下搜索变得十分关键[2 ] 。尽管搜索引擎的出现在一定程度上解决了人们的信息需求 ,但远没有达到令用户满意的程度。如何利用数据挖掘知识 ,进一步提高Web信息搜索的性能是众多学者研究的热点问题。O Etz…  相似文献   

17.
在逆全球化和中美科技脱钩风险激增的大背景下,大力发展战略性新兴产业是突破美国科技封锁的重要抓手,对经济社会全局的长远发展具有重大引领作用。研究利用专利申请和引用数据构建国际专利网络,并基于PageRank算法分析了中美两国在专利网络中的影响力以及中国的核心技术掌握情况,结果表明:PageRank算法计算得到的核心技术中,中国申请人所申请的专利占比逐年提升,中国在战略性新兴产业的国际专利网络中的影响力逐渐增强,但整体水平仍落后于美国。就具体行业而言,中国在新一代信息技术和数字创意产业的国际影响力增长迅速,并逐步在新材料掌握核心技术。本研究基于中美可能的科技脱钩背景,站在全球视角评估中国战略性新兴产业的专利影响力,为产业发展提供理论指导和决策参考。  相似文献   

18.
通过引文网络的结构特征,有效地识别科学文献的价值并建立某种序关系,为科学评价提供了有价值的参考,也丰富了科学评价的方法。针对传统PageRank算法在引文网络中得到的结果倾向于发表时间久的文献,而不利于发表时间较短但具有学术影响潜力的文献,为了消除这种“不公平”性,将引文间隔时间引入算法中。图书馆与情报学领域的实证研究说明改进算法有效地优化了评价的结果,相对于传统PageRank算法更有利于发现具有潜力的新发表的文献。  相似文献   

19.
李晶 《中国科技信息》2007,(24):347-348
为了查找方便,通常希望计算机中的表是按关键字有序的,因为有序的顺序表可以采用查找效率较高的折半查找法查找,因此,研究各种排序方法是计算机工作者的重要课题之一。该论文从直接插入排序的基本思想、算法、算法分析及稳定性等几个方面研究与分析直接插入排序方法,并阐述了直接插入排序算法实现的整个设计过程。  相似文献   

20.
杨泳丹 《科技通报》2019,35(7):178-181,185
针对PageRank算法存在的不足,本文对网络链接的结构进行分析,并以此为基础对PageRank的算法进行了改进,提出了主题链接相似度的PageRank算法。本文算法的核心是将当前网页与入链网页的主题相关度作为传递权值,替换PageRank算法中以平均值作为权值。本文的PageRank-I算法将网页之间的链接作为链接的向量,以这种链接的关系来对向量的余弦相似度进行主题相关性的描述,而不用对额外的文本信息进行处理,减少了系统负担。实验结果证实本文的PageRank-I算法在没有增加系统的额外负担的同时,也没有增加时间上的复杂度,解决了PageRank算法中主题漂移的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号