首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
一种改进的Apriori算法在web日志挖掘中的应用   总被引:1,自引:0,他引:1  
在对web日志挖掘的处理流程以及难点深入分析的基础上,为了达到更快挖掘频繁访问页面组的目标,提出一种改进的Apriori算法,主要通过减少候选项集和对事务数据库的压缩来实现性能的提高.候选项集的减少是通过对频繁项集的缩减间接来实现,事务数据库的压缩则通过一系列预先定义的规则来实现.实验数据表明,无论对于短事务集,还是长事务集,算法的性能都得到了提升,更好地满足了实际应用的需要.  相似文献   

2.
Web日志数据挖掘在服务器安全方面的应用   总被引:3,自引:0,他引:3  
目前服务器的安全成为人们关注的问题,而分析Web服务器的日志记录是最直接、最常用,而且是一种比较有效的方法。文章对提出了一种通过对Web日志进行数据挖掘技术来检测服务器面临的攻击和潜在的威胁,从而加固系统,保护系统数据免受修改和破坏。  相似文献   

3.
对高校学生考试成绩进行分析是教学管理的重要工作之一,传统的分析统计方法虽然方便快捷,但这种方法存在一些缺陷,不能客观而全面的反映学生的学习情况.使用数据挖掘中聚类分析方法对学生的原始成绩进行分析,可以有效地克服传统分析方法的缺陷.实验结果表明:k-means算法对学生成绩进行快速聚类具有较高的效率,能够有效地克服传统分析方法的缺陷.  相似文献   

4.
《宜宾学院学报》2016,(6):41-45
针对人工蜂群算法容易陷入局部最优值,收敛到最优解速度慢的缺点,通过使用固定步长和可变步长,定义采蜜蜂搜索食物源的公式,提出了一种改进的人工蜂群算法.对四个标准测试函数仿真表明该改进算法提高了算法的优化性能.为了改善数据挖掘中聚类算法效率,从人工蜂群算法评价函数入手,使用凝聚度函数、分散度函数,将改进的人工蜂群算法用于解决聚类问题,对三个数据集测试表明新算法在聚类准确率方面有一定提高.  相似文献   

5.
研究实现了一种改进的Apriori算法,通过对事务集进行扫描、删除对k一项频繁集无意义的事务,降低事务处理过程中频繁的连接次数来提高算法的效率.对图书借阅相关性挖掘的实际应用表明,随着数据量的增大,改进Apriori算法的时间效率可以提高10%以上.  相似文献   

6.
对数据挖掘技术关联分析Apriori算法做了介绍,并对Apriori算法做了分析,指出其在候选项集比较多的情况下效率低下的缺点,最后提出了利用建立临时数据库的方法来提高Apriori算法的效率。  相似文献   

7.
通过对我院校园网web服务器log记录进行数据挖掘,获取访问用户的特征和访问习惯,并与用户个人信息数据相结合,就能发现其中蕴含的知识,提取出用户的兴趣特征,从而开发有利于用户的界面,构建web智能化站点。  相似文献   

8.
一种改进的k-means聚类算法   总被引:2,自引:0,他引:2  
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值.  相似文献   

9.
Apriori算法是一种挖掘布尔型关联规则的典型算法。该算法在生成频繁项集时会有频繁的数据库扫描操作,并且在由低维频繁项集连接生成高维候选项集时,如果频繁项集维数过大,笛卡尔积后就会产生大量的候选项集,从而影响算法的效率。针对上述2个方面对Apriori算法进行改进,并将改进后的算法应用在试卷分析系统中。经过系统测试,改进后的算法具有较高的效率和较强的稳定性。  相似文献   

10.
对CF-树进行了改进,并在此基础上提出了一种新的基于改进CF-树的k-means聚类算法。该算法明显地改善了k-means算法所存在的在大数据集上的时间复杂性高、对噪声和孤立点数据敏感、不适合发现非凸面形状的簇或大小差别很大的簇等缺点。结果证明该算法提高了聚类的效率和准确性。  相似文献   

11.
对Web日志数据的预处理是Web日志挖掘的基础和关键。论文分析了Web日志挖掘处理的基本过程,分析讨论了Web日志挖掘中的数据预处理技术及其过程。  相似文献   

12.
长期稳定的更新是精品课程资源拥有生命力和价值的保障。但是,目前大部分精品课程在专家评审之后很少再去不断地更新,精品课程先进性、科学性、"示范课程"的价值也就得不到很好的体现。精品课程网站的日志记录了大量的学习者使用信息,通过web日志挖掘技术统计分析这些使用行为信息,对优化精品课程建设有重要意义。本文主要通过统计web日志中使用者的ip、访问时间、访问频率等信息,挖掘使用者的使用行为习惯,根据使用者使用行为习惯来模糊评价该精品课程资源的更新情况,以此督促精品课程建设者不断更新精品课程资源,保证其动态化。  相似文献   

13.
樊宁 《教育技术导刊》2010,9(3):145-146
利用Web数据挖掘技术从中找出潜在的规律或信息以提高电子商务企业的竞争力是一个迫在眉睫的问题。主要对Web数据挖掘的步骤和基于Web的数据挖掘的5种主要方法及应用进行了详细的研究。  相似文献   

14.
WEB日志挖掘在个性化网络教育中的应用   总被引:13,自引:0,他引:13  
本文介绍了Web日志挖掘的基本概念和过程,通过对学习者在网络教育中留下的日志信息进行挖掘,以实现个性化的网络教育,更好的满足不同类别学习者的需求。  相似文献   

15.
教育网站的Web数据挖掘   总被引:1,自引:0,他引:1  
将数据挖掘引入教育网站的建设中,以解决访问信息的有效获取问题,介绍了教育网站数据挖掘的意义,对数据挖掘的基本流程与结果进行了分析和探讨,提出了在站点中自动发现那些存储位置同用户期望的位置不同的Web页面的方法。  相似文献   

16.
事务日志是数据库系统实现数据恢复的必要条件,文中分析了事务日志的工作机制,介绍了一种在没有数据库备份文件的情况下,利用日志文件实现数据恢复的方法。文中的技术思想与方法时DBA(Data Base Administrator,数据库管理员)日常数据维护具有重要的指导意义:  相似文献   

17.
远程Web Usage Mining技术能对这些信息进行挖掘,并利用这些信息建立起一个智能化的、个性化的远程教育系统。这个系统通过对学习者学习行为的分析和研究,了解和掌握学生学习的情况、需求、能力、进度、兴趣等,及时调整学习计划,呈现符合个性的学习资源,使得每一个学生身边仿佛有了能针对自身特点进行教学的“老师”而获得个性化的教学服务。  相似文献   

18.
商业智能为大型企业带来了巨大利益,但中小型企业因现有产品价格过高、通用性差等而难以应用,而基于开放技术的商业智能模型具有扩展性强、价格低廉、维护方便等优点,适合中小型企业实现商业智能.  相似文献   

19.
An efficient enhanced k-means clustering algorithm   总被引:9,自引:0,他引:9  
INTRODUCTION The huge amount of data collected and stored in databases increases the need for effective analysis methods to use the information contained implicitly there. One of the primary data analysis tasks is cluster analysis, intended to help a user understand the natural grouping or structure in a dataset. Therefore, the development of improved clustering algorithms has received much attention. The goal of a clustering algorithm is to group the objects of a database into a set of m…  相似文献   

20.
数据挖掘在教育信息化中的潜在价值   总被引:3,自引:0,他引:3  
该文介绍了数据挖掘技术 ,阐述了其在教育信息化的应用前景和开发难点 ,指出数据挖掘这一领域尚有很大潜力可据  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号