共查询到20条相似文献,搜索用时 218 毫秒
1.
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了改进,提出了Apriori改进算法.Apriori改进算法采用二进制数据垂直表示方法,只用扫描事务数据库一次得到一阶大项集的二进制数据垂直表示.K阶候选项集的操作只要基于这个一阶大项集,而不需重复扫描数据库,从而提高了挖掘算法的效率. 相似文献
2.
Apriori算法是关联规则挖掘的一个经典算法,本文在分析关联规则挖掘算法的基础上,提出利用矩阵的数据挖掘技术对经典Apriori算法进行改进,从而提高图书馆数据资源的利用率,提高图书馆服务层次。 相似文献
3.
关联规则是数据挖掘的重要研究方向之一,Apriori算法是利用关联规则进行数据挖掘中的一个最经典的算法。通过对Apriori算法进行研究分析,发现该算法具有产生大量候选项集和多次扫描数据库的缺点。提出了一种基于矩阵按位存储的改进型Apriori算法,该算法将数据库中的数据读入内存,用矩阵按位存储数据,使用按位运算计算项集的支持数,提高了支持数计数的效率,从而提高了关联规则挖掘的速度和效率。 相似文献
4.
5.
在FDM算法的基础上,提出了一种改进的并行关联规则挖掘算法FDM_DT,此算法利用DHP算法中的Hash表技术改进了2阶侯选项集的生成过程,并采用Apriori Tid算法中的Tid表技术对事务数据库中的事务数进行有效消减。因此,此算法在处理大规模数据时有较高的综合效率。 相似文献
6.
针对Apriori算法、FP-Growth算法、RAGA算法,不同程度地出现运算速度慢、正确关联规则的提取率低,本文提出了基于组织多层次进化的关联规则挖掘算法。本文算法有较好的计算时间性能,本文算法对处理大规模数据也有着很好的性能。 相似文献
7.
股票交易系统积累了大量数据。对这些数据进行有效的分析处理,以发现在股票交易数据间的内在相互联系,对指导投资决策具有重要的意义。本文在经典Apriori算法的基础上,提出了一种考虑时间因素的关联规则挖掘算法,将其应用于股票市场,对各支股票间的关联规则进行了有效的挖掘和探讨,提高了挖掘过程的效率。 相似文献
8.
9.
控制出生性别比是计划生育管理中的难题,如何通过对育龄妇女的信息进行处理,辅助决策人口宏观政策是政府信息化建设的更新更高目标。本文介绍了数据挖掘技术的概况,详细讨论了数据挖掘中的关联规则方法,通过引入Apriori算法并进行改进,设计一种适合目标数据库的改进算法对影响出生性别比的因素进行客观的评估,并使用相关数据进行关联规则算法的实验,找出各种因素的影响程度,实现对结果的初步分析。 相似文献
10.
利用关联规则的Apriori数据挖掘算法及其改进算法,对电子商务中的数据进行分析挖掘。基于某电子商务网站实际数据的实验结果表明,该算法是有效的。 相似文献
11.
[目的/意义]科研数据是科研成果的原料与基础,对科研数据进行管理能够促进科研成果的再利用,推动科学技术螺旋式发展。科研数据管理理论为科研数据管理服务工作提供方向及指导。深入解析科研数据管理理论与服务研究进展,为我国科研数据管理发展提供更为全面和客观的发展建议。[方法/过程]文章利用文献调查及网络调研法对科研数据管理理论与科研数据管理服务的研究进展进行梳理,总结理论成果与服务特点。[结果/结论]构建了服务需求是前提、服务平台是路径、服务内容是核心、服务模式是桥梁、服务效果是目标的科研数据管理服务体系框架。最后从理论基础、管理工具、服务体系等方面提出建议。 相似文献
12.
13.
近年来,大数据浪潮兴起,大数据产业保持高速发展态势,大数据应用推进势头良好。政府数据作为价值密度高、涉足广度宽的数据资源,已成为各国争相创新开发的重要资产。但是长期以来,关于政府数据开发利用的理论研究却被忽视,如何科学有效地进行政府数据开发和利用已成为当前需要迫切关注的问题。文章系统总结了当前主要发达国家政府数据开发利用的政策措施和探索实践,以及通过梳理分析我国政府数据开发利用的政策体系和发展现状,尝试构建政府数据开发利用的过程机制模型,并提出:加强顶层立法,落实制度保障;扩大数据来源,提升数据质量;统一汇聚开放,深化行业应用;确立认证许可,明晰授权机制;创新开发模式,明确收益分配;推动试点先行,探索可行经验;强化技术支撑,保障数据安全等政策建议,以期为进一步推动政府数据开发利用提供决策参考。 相似文献
14.
[目的/意义]科学数据安全是国家信息安全的组成部分,随着数据科学研究的兴起,高校科学数据安全的政策研究有待深入。[方法/过程]采用网络调查的方法,对美国U.S.News前50名大学的科学数据管理内容进行分析,从“涉及对象”“保护方法”和“科学数据生命周期”等角度梳理政策重点和空白点。基于科学数据生命周期,从“制度层”“基础设施层”“数据素养层”和“实施层”四个主要层次,构建了高校科学数据安全的内容框架,并分别讨论了科学数据生命周期不同阶段与科学数据安全相关的各个主体的职责。[结果/结论]高校科学数据安全内容贯穿科学数据生命周期,相关主体包括制度层、基础设施层、数据素养层、执行层。 相似文献
15.
[研究目的]数据经济的迅猛发展,进一步突显了数据的财产权属性和商业化价值。因此,“商业数据”的类型提出和权属确认便对数据出境的法治化运行及安全责任的具体化落实具有重大意义。[研究方法]以“商业数据”的概念廓清与权属分析为切入,通过数据企业的“应然权利”为视角正向解析现有数据出境中限制性规定的规范边界和实践运行。[研究结论]数据权属是数据跨境规则建构的逻辑起点,数据企业基于数据劳动、数据生产而将数据自复杂的权益诉求中剥离时,理应享有法律所确认的数据权利而不受自由干预。据此,强调个人数据、重要数据“安全性”的同时,理应强化经由数据剥离后商业数据的“自由性”,以实现数据保护和数据开放的结构平衡。 相似文献
16.
通过对电视灯光数据来源与特性的理解,阐述数据管理对灯光工作的作用与意义,以期引发业内人士对电视灯光数据管理的重视与思考。 相似文献
17.
首先对大数据做简要诠释;其次重点阐述大数据在国内外各个领域的应用现状,以此来对大数据产业的发展、社会定位以及价值实现途径进行探索;最后分析我国大数据产业发展当中存在的主要问题并给出相关建议。 相似文献
18.
开放科研数据环境下科研人员的数据伦理框架研究 总被引:1,自引:0,他引:1
[目的/意义]为推动开放科研数据的发展,国内外除了已有的实践内容,包括数据政策颁布、数据基础设施建设等外,各国也均积极探索如何帮助科研人员克服与数据伦理有关的障碍,以辅助科学界实现预先设想的开放理念。[方法/过程]文章通过文献综述和网络调研的方法,分析了开放科研数据的实践进展,提出了数据伦理的概念和面向科研人员的数据伦理框架。[结果/结论]开放科研数据背景下数据伦理的框架主要由4个要素构成:利己主义因素、功利主义因素、利他主义因素及实用主义因素。 相似文献
19.
20.
【目的/意义】对高校科研数据展开治理,是提升数据价值,优化决策能力,节约科研成本的有效途径,而实施治理行为的重点之一是构建高校科研数据治理模型,从而在理论上指导治理行为。【方法/过程】研究以协同治理理论辅以数据生命周期理论和利益相关者理论为基础,在探明已有数据治理模型逻辑路线后,通过半结构化访谈法,对国内外高校人员就科研数据治理认知进行深度沟通,最终利用NVivo 11软件对访谈结果进行质性分析,提炼模型构建要素。【结果/结论】据此分模块构建高校科研数据治理模型,拟为高校科研数据治理提供理论模型,同时也为提升高校科研数据治理服务水平提供借鉴。 相似文献