共查询到20条相似文献,搜索用时 0 毫秒
1.
数据挖掘要在实际应用中发挥作用,高性能挖掘算法和数据挖掘软件平台是重要的技术基础。通过实例验证,提出了一种快速有效的多层多维关联规则增量更新算法。 相似文献
2.
针对关联规则负增量更新的挖掘问题,提出了一种高效的关联规则负增量更新算法,即NIUA。该算法充分利用原数据库中已有的频繁项集、所有1-项集来生成最小非频繁项集;并采用选样等策略求出删减数据后的频繁项集。整个算法只需扫描删减后的事务数据库一遍,从而提高了关联规则的更新效率。 相似文献
3.
4.
王卫华 《湖北成人教育学院学报》2007,13(4):97-98
针对数据删除的关联规则的更新问题,提出了一种新的算法,该算法充分利用了保留下来的原数据库中所有项目的计数以及挖掘出来的最大频繁项目集及其计数,找出更新后的数据库中新增的频繁一项集和被删除的原频繁一项集,进而挖掘出更新后的关联规则。 相似文献
5.
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网页搜索中具体实现的方法。 相似文献
6.
黄光明 《贵阳学院学报(自然科学版)》2008,3(1):9-13
数据仓库通常都包含预聚集.当数据源发生更新时,数据仓库及预聚集也必须随着更新.为了提高查询性能,重点探讨数据仓库预聚集更新问题,给出了预聚集更新的处理流程,并针对事实表更新及维表更新设计了相应的预聚集增量更新算法. 相似文献
7.
《实验室研究与探索》2013,(12):105-108
随着互联网的发展及网络信息的指数状增长,网络上出现了大量的重复网页,降低了检索的查全率和查准率,影响了检索效率。因此,网页去重的准确度直接影响着搜索引擎的质量。本文通过对结构化文本的描述,提出了一种基于MD5的改进的网页去重算法,并从算法内容、算法特征、算法设计进行了阐述,实验表明该方法对提高查全率和查准率具有很好的效果。 相似文献
8.
屈军 《赤峰学院学报(自然科学版)》2013,(13):23-24
如今文本自动分类技术发展已较为成熟,中文网页的分类也是自动分类技术的应用之一.分类精度依赖于分类算法,贝叶斯算法在网页分类中有很广泛的使用,但它需要大量且已标记的训练集,而获得大量带有类别标注的样本代价很高.本文以中文网页信息增量式的学习作为研究对象,利用网页已验信息处理训练集增量问题,提出一种改进的增量式的贝叶斯分类算法,研究利用未标记的中文网页来提高分类器的性能,并进行相关实验对比和评价. 相似文献
9.
为了按用户偏好对搜索结果进行排序,提出了一种新的个性化网页排序算法PWPR.PWPR基于按照用户偏好调整网页排序的思想,根据用户兴趣为网页分配初始权值,并建立虚连接,通过测量用户的点击流实现用户喜好的区分.对于具有相似兴趣的用户提交的相似关键词查询,PWPR采用协作过滤方式提高排序精确性.仿真结果及与其他算法的比较证明PWPR算法能自适应地实现个性化排序,并根据用户偏好提供相关查询信息. 相似文献
10.
操惊雷 《黄冈师范学院学报》2009,29(3):50-52,66
从使用搜索引擎的角度,对于搜索引擎返回的结果,用户只关心那些包含信息的内容部分。以此为需要,本文研究了网页中信息部分识别技术,对于当今存在的各种网页中信息部分识别技术进行优缺点对比,并提出新的算法。针对网页中内容的特点,第一步将网页中的内容划分为块,第二步从划分出来的块中识别出内容。依据网页元素中的各种HTML特征和实际经验中不断调整规则和变量值,完成了对信息部分的识别,最后,通过实验证明本文提出的算法具有良好的效果。 相似文献
11.
12.
林蔚凯 《中阿科技论坛(中英文)》2023,(10):80-84
2023年2月,中共中央、国务院印发《数字中国建设整体布局规划》,指出建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。地理信息数据作为重要的生产要素和战略性数据资源,支撑治国理政,赋能各行各业,在推动高质量发展中具有基础性先行性的重要地位和作用。面对数字经济发展新形势,为保证基础地理信息数据的现势性,应不断对其进行管理与更新。传统的基于基础地理信息数据库的全覆盖式更新不仅效率低,还难以与现存的其他数据库进行融合与联动更新。基于此,文章介绍了基于Smart GIS地理信息平台的测绘成果管理系统,将增量更新技术运用到基于数据库生产更新中,设计了地理要素数据库和数据库管理系统。经实践证明,该系统有助于提高基础测绘数据生产更新的效率,能高效满足测绘成果管理与更新的需要。 相似文献
13.
侯宁 《湖北广播电视大学学报》2013,(11):157-158
预测控制是一种新型的控制算法,该算法最早是在20世纪70年代由Richalet.J在其论文著作中提出.随着控制技术的不断发展以及学者的不断研究与应用,如今预测控制的相关研究已经逐渐趋近于成熟.通过对预测控制的发展和预测控制算法的现状进行探讨,主要包括理论研究与应用研究的分析、算法分析等内容.阐述了当前预测控制在工业控制领域中的发展、算法的现状和今后的研究展望. 相似文献
14.
15.
目前,已经有很多针对数据挖掘更新算法的研究,但大部分的更新算法都只是考虑事务数据库增量更新的情况.实际上,事务数据库数据还存在数据删减的更新问题,为了解决这类问题,提出了一种基于闭合序列模式的更新算法DeCloSpan,该算法对已有的挖掘结果直接进行删减更新,避免了重复挖掘. 相似文献
16.
17.
18.
本文探讨了数据挖掘和搜索引擎的理论框架,以去除内容重复的冗余网页为研究目标,分析了搜索引擎工作原理,讨论了现有的去重算法。给出了一种基于特征码的网页去重算法,并采用二叉排序树实现了算法。实验证明算法有着较高的去重准确率、召回率,达到了对算法的预期。 相似文献
19.
20.
基于在线学习行为预测学生成绩可以辅助教师动态掌握学情,制定差异化的教学策略,然而在混合课程中仅仅依据在线数据对学生成绩迸行预测难度很大,尚处于探索中.文章选取某高校2018秋季学期和2020春季学期的"高活跃型混合课程"学生在线行为数据,采用增量学习的随机森林算法构建学生成绩预测模型,研究发现:(1)增量学习随机森林算法在混合课程样本最多的数据集中,获得预测结果准确率最高(75.1%);(2)相较于批量学习随机森林算法,增量学习算法在数据样本量较多的数据集中预测结果准确率更高;(3)当样本数量达到一定规模后,预测结果准确率波动减小、稳定性增强.本研究采用增量学习随机森林算法预测混合课程中的学生成绩,不仅取得了较好的预测准确率,而且解决了新增数据后模型的稳定性问题,将有助于模型的迭代优化,提高模型的通用性,以及可持续追踪学生在不同学期的学习行为特征. 相似文献