首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
PageRank算法是Google商业应用的关键技术之一。探讨PageRank算法的原理、优缺点,基于连接本身的属性特点,赋予链接不同的权重,提出基于链接本身属性的算法改进思想。数据验证表明,改进的算法可以使得重要的网页排名提前,改进搜索结果。  相似文献   

2.
提出了一种基于Lucene评分机制的PageRank改进算法,实现两者之间算法的有效互补,并利用Lucene框架搭建一个校园网搜索引擎,用以验证新算法的特性.  相似文献   

3.
互联网的迅速发展,搜索引擎也引起了更多人的关注,但主题搜索引擎发展还不够成熟,在国内,它的研究正处于发展阶段,发展缓慢、数量少,用户还不满意.本文提出了一种基于主题预分类的PageRank算法,与传统PageRank算法比较,经验证,该方法在一定的主题下可以提高系统的查准率.  相似文献   

4.
针对PageRank算法查准率和检索效率低的问题,通过增加用户点击率、网页发布时间以及主题内容相关度3个影响因子改进PageRank算法,提高用户查准率;利用MapReduce技术实现改进的PageRank算法,提高网页排序和检索效率;最后通过实验结果数据对比,发现用户检索效率和用户查询准确率有较大提高。  相似文献   

5.
目前,已经提出了许多挖掘关联规则的算法及其变型,其中最著名的是Apriori算法,但传统的算法效率太低,为了解决这些问题,提出了一种快速更新的关联挖掘算法。  相似文献   

6.
余润海 《考试周刊》2009,(24):181-181
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网页搜索中具体实现的方法。  相似文献   

7.
自PageRank提出以来,就引起了学界广泛关注。在概述PageRank算法的基础上,从Topic-RelatedPageR-ank﹑时间维加权PageRank和科研学术网络中加权PageRank这3个方面对加权PageRank算法进行了综述和评价。  相似文献   

8.
改进后的Fp-Growth挖掘算法适用于对大型数据库的数据关联规则的挖掘,基于一种新的数据库分隔方法来分隔数据库,并对分隔得到的各数据库子集用算法进行约束频繁项集挖掘。改进的数据库划分策略克服了占用内存大的缺陷,提高了挖掘速度,实时性更强。  相似文献   

9.
关联规则可在庞大的数据集中找出不同事务之间隐藏的关系,其中Apriori算法是关联规则分析中较为有效的办法。然而,Apriori算法产生候选项集的效率较低且扫描数据过于频繁,造成算法计算需要耗费较长时间。另外,初始定义的最小支持度与最小置信度也不足以过滤无用的关联规则。针对以上问题,利用概率理论与有效的参数设置,在原有Apriori算法基础上,提出一种基于概率事务压缩的关联规则改进算法。数值算例结果表明,新算法可在第二次迭代之后,大幅减少低效候选项集,从而提升经典Apriori算法效率。  相似文献   

10.
本文在FP-Growth算法的基础上,提出了一种基于时间权重的FP-Growth改进算法。该改进算法把不同时间段的记录赋予不同的权重,使不同的时间段内的记录有不同的重要性,在获得频繁一项集和生成FP-Tree的过程中,不同时间段的记录具有不同的权重,可以使某些项更有可能包含在频繁一项集中,从而增加了该项生成FP-Tree的可能性。并以实例对改进算法的优越性进行了验证,进一步说明了改进算法比经典算法更符合实际情况。  相似文献   

11.
Apriori关联规则挖掘算法分析与改进   总被引:1,自引:0,他引:1  
对数据挖掘及关联规则挖掘的定义及相关概念作了简单的介绍,对基于关联规则的Apriori算法基本思想及其核心算法作了深入剖析,提出了该算法的瓶颈问题,并就此问题提出了改进思路,同时对改进的Apriori算法进行了评价.  相似文献   

12.
数据挖掘应用极大地推动了人们掌握、处理信息的能力,本文主要介绍了数据挖掘中的关联规则,关联规则中的经典算法Apriori算法,以及Apriori算法存在的不足,提出了Apfiori算法的改进研究,  相似文献   

13.
关联规则挖掘的一种改进算法   总被引:1,自引:0,他引:1  
关联规则的提取是数据挖掘中的重要研究课题,文章对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法.  相似文献   

14.
本文首先对数据挖掘的定义及其发展现状作了简单的介绍,然后从背景、内容、效率、复杂度等方面对基于关联规则的Apriori算法做了深入介绍,最后分析了这个算法的瓶颈问题,并就此问题提出了改进方案。  相似文献   

15.
根据数据挖掘中关联规则的性质以及高校成绩管理数据库的自身特点,在经典关联规则算法Apriori算法的基础上提出了一种改进的算法A 算法,并利用该算法对学生成绩管理数据库进行了关联规则挖掘,得到了隐含在数据库中的有用信息。  相似文献   

16.
在Apriori算法的基础上,提出由候选集快速产生强项集的算法:采用动态分配存储空间合理分配内存,将数据库中的数量相关问题转换成逻辑相关问题,给出计算长度k的强项集存储分配公式,由候选(k+1)一项集的集合Gk+1,产生(k+1)-项强项集来表达关联规则.  相似文献   

17.
微软在推出SQL Server 2005时,其中包含七个数据挖掘算法,时序算法是其中的一个。文章在讨论经典时序算法的基础上,对微软时序算法进行了介绍,并对它的优缺点进行了比较。  相似文献   

18.
对学生成绩数据挖掘的研究、开发、应用,可以进一步探讨数据挖掘的过程、功能;并且用于指导帮助学生发现、认识学习的一些基本规律;同时也可以为教师、教学部门提供相应的决策依据。文章通过对加权关联规则算法的研究,进一步提高了算法的运行效率,以及数据挖掘结果的有效性、可用性。  相似文献   

19.
文章在研究多维关联规则挖掘算法的基础上,提出了一种适合关系型弱点数据库的高效的多维关联规则挖掘算法AprioriTidList +.该算法以Apriori算法思想为核心,通过对单维的层次算法AprioriTidList进行改造得到.通过与多种算法的比较、分析,对AprioriTidList+算法的优点进行了介绍.  相似文献   

20.
根据数据挖掘中关联规则的性质以及高校成绩管理数据库的自身特点,在经典关联规则算法Apriori算法的基础上提出了一种改进的算法——A++算法,并利用该算法对学生成绩管理数据库进行了关联规则挖掘,得到了隐含在数据库中的有用信息.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号