首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

2.
叶萌 《黑龙江科技信息》2011,(30):40+39-40,39
关联规则是数据挖掘领域的一个重要分支,它反映了一个事物与其他事物之间互相依赖的关系。提出了一种简易而有效的频繁模式挖掘算法作为基础,利用频繁模式树对大型原始事务数据库进行压缩存储,并且给出了具体实现算法。与传统的算法比较,避免了反复进行候选集的生成与测试,大大提高了算法效率。  相似文献   

3.
宋庆元 《科技广场》2005,17(1):53-57
本文介绍了一种针对化学数据分析的挖掘系统原型实现和设计理论。阐述从化学数据分析的角度开发一个联机分析数据挖掘系统原型的理论过程,研究过程采用数据仓库提供的OLAP技术进行关联规则挖掘,提供了一种数据项的二进制编码技术,对于提高数据信息的处理能力和可靠性有一定意义。预期实现从各种文献资料或数据库自动抽取有关化学反应的信息,发现新的有用化学成分,完成合成设计和反应预测等功能,从而对数据挖掘的实现进行了有益的尝试。  相似文献   

4.
在大型数据集进行数据挖掘时,现有算法仍需要和外存多次交换数据才能完成挖掘任务。针对此问题提出了一种新的自适应的混合压缩算法:AHC-DM算法。该算法主要通过在垂直事务标识向量的基础上进行比特位压缩来节省内存空间。其结果是当数据集事务差成脉冲型出现时,对数据集有较好的压缩比率;也同时能自动适应数据的稠密和稀疏。  相似文献   

5.
目前,数据挖掘已经成为一个研究热点。而遗传算法作为一种有效的全面并行优化搜索工具,成为数据挖掘的主要算法之一。本文提出了一种基于改进遗传算法的数据挖掘方法,并将其应用于劳务公司员工管理系统。实验表明,该算法具有很强的随机性、鲁棒性和隐含并行性,能快速、有效地进行全局搜索,是处理大规模数据的有效方法,不仅有效克服了遗传算法的"早熟"现象,而且在很大程度上提高了搜索效率。  相似文献   

6.
如何进行云计算下的数据挖掘一直以来都是研究的重点,本文针对传统挖掘算法K-meas的不足,提出基于数据采样和分布密度的改进方法来获取算法的中心点,在聚类中构造函数提高了聚类效果,并对云计算下的Map/Reduce模型进行了函数改进,仿真实验通过对不同的数据集进行实验,从聚类分析比较,系统运行时间,加速比等方面说明了本文的算法适合在云计算下的数据挖掘具有一定的优越性。  相似文献   

7.
针对K-means聚类算法中的k值确定给聚类算法效果带来不确定性的问题,本文通过引入多层变量加权概念,提高聚类效果的收敛性,引入改进的非加权组平均法和最大最小距离算法有效的解决k值确定问题,引入Max-Entropy算法解决分布簇内节点分布不均导致的计算问题。仿真实验中,将本文算法的改进的效果进行研究,并结合云计算环境下通过使用本文算法在挖掘的加速比,花费时间上都取得了比较好的效果。  相似文献   

8.
针对关联规则挖掘算法中存在事务之间的某种关联性的数据无法区分的问题,本文将蚁群算法和加权概念引入到挖掘算法中,首先分析了目前加权关联规则挖掘算法的不足,提出了将蚁群算法引入到加权关联规则中,并对蚁群算法中的应度函数,状态转移规则和信息素更新的改进,并采用矩形向量作为事务存储结构进行连接和剪枝。仿真实验中与基本Apriori算法进行比较,并通过将本校的课程资源作为挖掘对象,结果说明本文算法具有良好的挖掘效果。  相似文献   

9.
伴随着网络技术的持续发展,新时代的数据多数是非结构化类型的数据信息,其特征向量的维数较高,过多的维数会引发维度灾难,通过引入特征选择的模式对于冗余特征进行检测,数据信息的特征子集能够准确获得,实现降维目标.随后由聚类成员质量以及数据差异入手,总结出适于高维数据信息分层抽样的算法.结果表明,此算法具备良好的聚类优势.此研...  相似文献   

10.
一种改进的K-means算法   总被引:1,自引:0,他引:1  
K-means算法是聚类算法中最经典的划分算法之一,它对初值的依赖性很强,聚类结果随初始聚类中心选择的不同而波动很大。提出了一种改进的K-means算法,运用Kruskal算法生成聚类对象的最小生成树(MST),按权值从大到小删去K-1条边,得到的K个连通子图中对象的均值作为初始聚类中心进行聚类。由仿真实验表明,K-means算法较传统算法有更好的聚类效果和准确性。  相似文献   

11.
提出了一种冒泡排序的改进算法,并对其性能与传统的冒泡排序算法的性能进行了实验比较。  相似文献   

12.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有趣的关联。Apriori算法是关联规则挖掘中的经典算法。然而Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。提出了一种新的Apriori的改进算法,该算法在生成k(k>1)项频繁集时,不需要重新扫描数据库,只是在生成1项频集时,才需要扫描事务数据库,有效地减少了对事务数据库的读操作,在时间复杂度上较经典的Apriori算法有更加优越的性能。  相似文献   

13.
刘云枫  柯林 《情报杂志》2008,27(5):55-57
提出一种数据挖掘算法,在数据挖掘的同时进行数据预处理,这种算法保证了数据的真实性,省略了数据预处理环节,规避了粗糙集算法对数据规范性的严格要求.  相似文献   

14.
随着互联网的广泛应用与云计算技术得到飞速发展,如何从大数据中寻求数据规律,并以此做出科学的预测与决策,成为目前数据挖掘技术的主要研究方向之一。Apriori算法就是一种基于海量数据并挖掘关联规则频繁项集的典型算法,其在大数据挖掘分析中具有较大研究与应用价值。  相似文献   

15.
本文针对标准人工蜂群算法开发能力较弱的缺点,借鉴粒子群算法的思想,将全局最优解引入,与引领蜂进行交叉操作,使蜂群进行有引导的探索,通过基准函数的测试,证明了改进后的算法性能有所提高。  相似文献   

16.
传统的模式匹配算法匹配效率较低,有时无法满足入侵检测、搜索引擎等系统性能需求。为此,在BM算法及其衍生算法的基础上,提出了一种高效的模式匹配算法—BMQ算法。该算法利用模式串末字符对应的文本字符与文本字符下一个字符的独特性和组合性,有效提高了模式串最大右移位数出现的概率,加快了匹配速度。通过实验对比,BMQ算法的效率优于BM匹配算法;为进一步验证其有效性,将改进后的算法引入到入侵检测系统中,实验测试结果表明,BMQ算法提高了入侵检测效率。  相似文献   

17.
遗传算法有早熟和局部搜索能力弱的缺点,而模拟退火算法没有较好的全局搜索效率。引入了一个新的选择机制来改进模拟遗传退火算法,使速度得到了提高并且可以避免早熟等缺陷。  相似文献   

18.
SPIHT算法是公认的编码效率最高的静止图像压缩编码方法之一,能够对码流的任意位置进行截断来实现对图像的压缩,但是却不能保证所截断的位置是在当前的比特率下最优的,本文提出了最优截断方法来补偿这个不足,根据整个图像的最优截断曲线的截断点来寻找各个单位块的相应截断点,从而实现对整个图像的最优截断。  相似文献   

19.
人工鱼群算法是一种高效的群体智能寻优算法。本文提出一种改进智能鱼群算法,引入云学习因子和云变异因子,使算法在寻优过程中的学习能力有所提高,避免算法在寻优过程中游动行为的不确定性,提高了算法的寻优能力。  相似文献   

20.
本文通过反馈控制理论对RED算法中的最大丢弃概率公式作了一些改进,设计出一种新算法。仿真实验表明它的稳态和瞬态性能都优于原RED算法并且在负载扰动时性能也有了一定的改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号