共查询到20条相似文献,搜索用时 15 毫秒
1.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。 相似文献
2.
关联规则是数据挖掘领域的一个重要分支,它反映了一个事物与其他事物之间互相依赖的关系。提出了一种简易而有效的频繁模式挖掘算法作为基础,利用频繁模式树对大型原始事务数据库进行压缩存储,并且给出了具体实现算法。与传统的算法比较,避免了反复进行候选集的生成与测试,大大提高了算法效率。 相似文献
3.
本文介绍了一种针对化学数据分析的挖掘系统原型实现和设计理论。阐述从化学数据分析的角度开发一个联机分析数据挖掘系统原型的理论过程,研究过程采用数据仓库提供的OLAP技术进行关联规则挖掘,提供了一种数据项的二进制编码技术,对于提高数据信息的处理能力和可靠性有一定意义。预期实现从各种文献资料或数据库自动抽取有关化学反应的信息,发现新的有用化学成分,完成合成设计和反应预测等功能,从而对数据挖掘的实现进行了有益的尝试。 相似文献
4.
在大型数据集进行数据挖掘时,现有算法仍需要和外存多次交换数据才能完成挖掘任务。针对此问题提出了一种新的自适应的混合压缩算法:AHC-DM算法。该算法主要通过在垂直事务标识向量的基础上进行比特位压缩来节省内存空间。其结果是当数据集事务差成脉冲型出现时,对数据集有较好的压缩比率;也同时能自动适应数据的稠密和稀疏。 相似文献
5.
目前,数据挖掘已经成为一个研究热点。而遗传算法作为一种有效的全面并行优化搜索工具,成为数据挖掘的主要算法之一。本文提出了一种基于改进遗传算法的数据挖掘方法,并将其应用于劳务公司员工管理系统。实验表明,该算法具有很强的随机性、鲁棒性和隐含并行性,能快速、有效地进行全局搜索,是处理大规模数据的有效方法,不仅有效克服了遗传算法的"早熟"现象,而且在很大程度上提高了搜索效率。 相似文献
6.
7.
8.
9.
10.
一种改进的K-means算法 总被引:1,自引:0,他引:1
K-means算法是聚类算法中最经典的划分算法之一,它对初值的依赖性很强,聚类结果随初始聚类中心选择的不同而波动很大。提出了一种改进的K-means算法,运用Kruskal算法生成聚类对象的最小生成树(MST),按权值从大到小删去K-1条边,得到的K个连通子图中对象的均值作为初始聚类中心进行聚类。由仿真实验表明,K-means算法较传统算法有更好的聚类效果和准确性。 相似文献
11.
12.
13.
提出一种数据挖掘算法,在数据挖掘的同时进行数据预处理,这种算法保证了数据的真实性,省略了数据预处理环节,规避了粗糙集算法对数据规范性的严格要求. 相似文献
14.
15.
本文针对标准人工蜂群算法开发能力较弱的缺点,借鉴粒子群算法的思想,将全局最优解引入,与引领蜂进行交叉操作,使蜂群进行有引导的探索,通过基准函数的测试,证明了改进后的算法性能有所提高。 相似文献
16.
17.
遗传算法有早熟和局部搜索能力弱的缺点,而模拟退火算法没有较好的全局搜索效率。引入了一个新的选择机制来改进模拟遗传退火算法,使速度得到了提高并且可以避免早熟等缺陷。 相似文献
18.
SPIHT算法是公认的编码效率最高的静止图像压缩编码方法之一,能够对码流的任意位置进行截断来实现对图像的压缩,但是却不能保证所截断的位置是在当前的比特率下最优的,本文提出了最优截断方法来补偿这个不足,根据整个图像的最优截断曲线的截断点来寻找各个单位块的相应截断点,从而实现对整个图像的最优截断。 相似文献
19.
20.
本文通过反馈控制理论对RED算法中的最大丢弃概率公式作了一些改进,设计出一种新算法。仿真实验表明它的稳态和瞬态性能都优于原RED算法并且在负载扰动时性能也有了一定的改善。 相似文献