共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
5.
《科技通报》2017,(5)
目前大多都是针对两种类型数据发现对照模式来获取相关信息,在多类数据中发现对照模式进行数据挖掘还具有很大的挑战性。现有的关联规则挖掘技术的瓶颈在于需要产生大量的规则,其中有很多都是冗余规则,而已存在的非冗余规则挖掘算法虽然去掉了冗余规则,但还是有很多规则对于特定的应用领域兴趣度太低或不感兴趣,因此给出了一种有效的多类医疗数据挖掘算法。该算法基于统计方法定义了诱因模式和安全模式,实现了在多类医疗数据中发现这两类模式,并在仿真实验中给出了仿真医疗数据清晰直观的因果关系图,而根据新算法产生的规则得出的分类器也验证了新算法的高效性和实用性,且新算法产生的规则提供了精确而且非常有用的信息,可被实际应用在医疗研究以及其它领域中。 相似文献
6.
7.
8.
在大型数据集进行数据挖掘时,现有算法仍需要和外存多次交换数据才能完成挖掘任务。针对此问题提出了一种新的自适应的混合压缩算法:AHC-DM算法。该算法主要通过在垂直事务标识向量的基础上进行比特位压缩来节省内存空间。其结果是当数据集事务差成脉冲型出现时,对数据集有较好的压缩比率;也同时能自动适应数据的稠密和稀疏。 相似文献
9.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。 相似文献
10.
11.
关联规则是数据挖掘领域的一个重要分支,它反映了一个事物与其他事物之间互相依赖的关系。提出了一种简易而有效的频繁模式挖掘算法作为基础,利用频繁模式树对大型原始事务数据库进行压缩存储,并且给出了具体实现算法。与传统的算法比较,避免了反复进行候选集的生成与测试,大大提高了算法效率。 相似文献
12.
在大数据背景下进行数据挖掘越来越受到重视,针对Apriori挖掘算法中存在消耗时间长,算法效率低的特点,采用添加数据库、改进频繁1-项集,改进频繁2-项集和引入动态存储空间等措施,提高Apriori算法的性能,仿真实验中,本文算法在时间消耗、CPU耗能和挖掘效果上都取得了良好的效果。 相似文献
13.
将多参数随机干扰与Pailler同态加密进行结合,提出一种新的基于隐私保护的面向关联规则的水平分布式挖掘算法,提高了面向关联规则的分布式隐私保护的安全性能。算法中计算候选项集的局部支持度是通过多参数随机干扰求得的,一方面具有不同事物所有相的性质,另外一方面改善了挖掘的准确。通过使用同态加密技术获得的整体支持度,有效控制了计算与通信的成本。分析仿真实验结果可知本文提出的基于隐私保护的面向关联规则的水平分布式挖掘算法性能比单纯以加密为基础的PPDAR算法优良,当最大频繁项集的最大长度与频繁项集的最大长度两者存在一定差距时,本文提出的算法性能优于以加密为基础的EPPDAR算法。 相似文献
14.
本文主要介绍了算法的目的、作用、优缺点和实现过程,并通过文字、图等方式呈现给读者,希望该算法能给相关人员将来开发嵌入式产品时作为一种软件设计参考. 相似文献
15.
<正>用户画像(User Profile)能够完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供了足够的数据基础。考虑到设计师岗位的多样化,包含从事结构设计工作、原理设计工作、仿真设计工作、制图工作等岗位,而机械制图工作又包括二维制图、三维制图、工业设计制图等。针对机械制图工作,不同设计师设计方向不一样,能力不一样。为了更清楚各个设计师的能力以及设计师团队整体能力情况包括人员结构合理性等,提出构建设计师用户画像系统,从业务上针对设计师制图工作的人群进行画像,对设计师综合能力进行不同等级划分,从企业角度和设计师个人角度深入认识设计人员结构合理性和任务匹配合理性。 相似文献
16.
17.
本文介绍了一种针对化学数据分析的挖掘系统原型实现和设计理论。阐述从化学数据分析的角度开发一个联机分析数据挖掘系统原型的理论过程,研究过程采用数据仓库提供的OLAP技术进行关联规则挖掘,提供了一种数据项的二进制编码技术,对于提高数据信息的处理能力和可靠性有一定意义。预期实现从各种文献资料或数据库自动抽取有关化学反应的信息,发现新的有用化学成分,完成合成设计和反应预测等功能,从而对数据挖掘的实现进行了有益的尝试。 相似文献
18.
隐私数据挖掘是数据挖掘的一个重要研究方向,它旨在研究在数据挖掘过程中如何保护私有的和敏感的数据不被泄露。文章阐述几种常用的隐私数据挖掘算法,分析它们的技术特点,文末对几种隐私数据挖掘技术进行总结与展望。 相似文献
19.
20.
1 引言企业(或个人)的投资是当前的一种支出,这种支出预期将来能有利润收入。这种利润收入延续的时间通常在一年以上,所以,投资决策有两个重要特点:第一,在投资决策中,需要把不同期的现金收支相比较,因此必须考虑资金的时间价值;第二,在投资决策中,方案评价所涉及的问题,大都属于对未来的预测.如对投资方案的经济寿命期、投资成本、投资收益等的预测.由于人们认识的局限和现有资料的不完善,以及客观环境条件的多变,对于那些未来的事件,人们很难预测得很准确,因而,一般说来,投资方案总是包含有不确定性(风险),如果不把这种不确定性列入方案评价的分析计算中去,就会影响方案选择的合理性和可靠性,甚至导致决策失误。这就不得不考虑方案的风险价值。长期投资决策中最常用的净现值 相似文献