首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
【目的】基于当前大数据技术支撑的主流传播数据挖掘逻辑机制,即作者关联度机制及文献碎片化自然语言处理机制,围绕传播对象的相关性、时效性等维度进行实验设计和数据统计。【方法】在CNKI数据库中按照学科分类随机选取100篇文献作为传播样本,在各机制应用平台挖掘共计10000个传播对象进行德尔菲式的判定及数据统计分析。分析维度涉及时效相关性、匹配相关性、发文频率等一系列图情指标。【结果】分析显示,作者关联度机制存在内生性问题,难以继续优化;文献碎片化自然语言处理机制虽存在学科分类表象与匹配聚类实质不易弥合的客观问题,但可以通过优化数据挖掘逻辑提升数据挖掘效果。【结论】基于分析结果,通过改进算法映射及摒弃“超龄”数据来提出优化路径,并通过实验验证其有效性。  相似文献   

2.
大数据与大数据经济学   总被引:2,自引:0,他引:2  
本文从大数据的发展现状分析入手,讨论了大数据对传统经济学的挑战,首次提出大数据经济学的概念.认为大数据经济学包括大数据计量经济学、大数据统计学和大数据领域经济学,并分析了大数据经济学与信息经济学、信息技术等相关学科的关系,最后对大数据经济学发展前景进行了展望,认为大数据经济学不仅将理论科学、实验科学、复杂现象模拟统一在一起,而且将自然科学和社会科学统一在一起,将理论研究与实践应用实时地统一在一起,大数据经济学具有“智能经济学”的特点.  相似文献   

3.
首先对大数据做简要诠释;其次重点阐述大数据在国内外各个领域的应用现状,以此来对大数据产业的发展、社会定位以及价值实现途径进行探索;最后分析我国大数据产业发展当中存在的主要问题并给出相关建议。  相似文献   

4.
作为人类的新型战略资源,大数据已成为知识经济时代的战略高地。其少量依赖因果关系、主要依靠数据相关性发现知识的新模式,使得其成为继经验、理论和计算模式之后的数据密集型科学范式的典型代表,带来了科研方法论的变革,正成为科学发现的新引擎。科学大数据作为大数据的重要分支,具有不可重复性、高度不确定性、高维性及计算分析高度复杂性的内部特征,以及在数据内容、数据体量、数据获取、数据分析等方面的外部特征,这给科学大数据的处理技术与方法提出了新的挑战。在以上分析基础上,文章提出了科学认知科学大数据,建设科学大数据基础设施,建立科学数据研究中心,以及构建科学大数据学术平台等建议。  相似文献   

5.
现有"大数据观"是在先入为主的情况下形成的,存在一些偏差或错误,有必要加以辨析、纠偏。从大数据概念角度分析,不能将数据规模的大小作为衡量大数据的标准,不必强调大数据与小数据之间的区分与对立,而应该推动不同数据的多元融合。从大数据功能角度分析,"让大数据发声""大数据革命""数据为王"等表述,夸大了大数据的作用,关于大数据功能的定位也不准确;其实,大数据同样存在缺陷和不足,它的功能是有限的,甚至还可能会带来危害。  相似文献   

6.
大数据具有规模大、种类多、生成速度快、价值巨大但密度低的特点。大数据应用就是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程。本文主要介绍了大数据定义、大数据应用领域及对大数据的展望。  相似文献   

7.
浅析大数据     
信息社会的快速发展引发了数据规模的爆炸式增长,大数据中蕴含了巨大的经济、社会和商业价值。本文分析了大数据的特点,以及这些特点对大数据分析带来的挑战。  相似文献   

8.
文章介绍关联数据对象共指的特点、具体问题及对应用的影响,总结两类共指识别方法,并详细分析两个共指管理系统,以便为相关研究、应用提供借鉴。  相似文献   

9.
"大数据时代"的到来以及数据密集型知识发现方法论为科学研究提供了全新的机遇与挑战。基于此,国际科技数据委员会(CODATA)联合全球6个大型国际学术组织以及中科院遥感与数字地球所于2014年6月在北京举办了大数据与科学发现国际研讨会。本次研讨会对大数据及科学大数据的本质特征进行了分析,对大数据予大科学研究的知识发现开展了研讨,对大数据予大科学计划的应用提出了建议,并针对大数据服务科学计划使命提出了未来行动纲领。  相似文献   

10.
数字技术为广播技术带来了一场深刻的革命.在数字电视技术取得成功之后,人们发现,这种革命的意义可能不仅仅是数字电视本身,它也为任何数字信息广播开启了大门.其中,数据和对象轮播协议在教据广播中各有所长.基于数据轮播协议的数据广播系统更适合于非树型组织方式的决状数据广播,而基于对象轮播协议的数据广播系统能够更好地满足当前对结构化数据广播业务的需要.  相似文献   

11.
分布式数据库系统是一种结合了计算机网络系统的数据库产品。在分布式数据库中如何得到一个最优化的数据分配方案是分布式系统性能优化所应该考虑的一个重要的方面,数据的分布问题对分布式数据库应用系统的改进、数据可用性、分布式数据库的效率和可靠性有着重大影响。本文的分配策略应用了遗传算法方面的一些优秀特性如并行性和健壮性、标准方法的实现、维持深度优先搜索与广度优先搜索之间的良好平衡等等。因此,本文中的分配策略执行效率高、寻求最佳全局解决方案的能力强且易实现。  相似文献   

12.
为使面向对象的开发与设计工作更加标准化、规范化,结合工作实践提出了面向对象软件开发环境的数学模型;论述了基类对象集的确定方法、类库管理系统和对象数据库管理系统的特征与实现,以及多维信息的组合和自动求解方法等.  相似文献   

13.
网络控制系统(NCS)系基于网络的分布式控制系统,其控制性能与所采用的调度策略及控制算法有关。本文利用Matlab环境下的仿真工具Truetime构建NCS仿真平台,实现NCS中控制与调度的联合仿真,并分别在丢包率、传输时延、扰动等若干因素的单独及共同作用下,构造多种不同的网络环境,分别对NCS中典型的静态调度算法RM和动态调度算法EDF进行仿真研究,比较两种算法对直流电机对象的调度效果。  相似文献   

14.
在流媒体大数据调度中,因路径损耗较大,产生调度延时和频谱失真,需要对路径损耗进行优化评估,提高对流媒体大数据库的访问速度和检索定位。提出一种基于交叉集聚变异最小延时的流媒体大数据调度路径损耗评估模型,基于遗传算法设计流媒体数据集聚调度模型,得到流媒体数据调度的位置变换策略。确定流媒体数据编码方案,构建流媒体网络通信代价矩阵控制的数据调度路径损耗模型,实现算法改进。实验结果表明,该模型能使流媒体数据调度路径损耗有效降低,优化流媒体数据传输,最终达到最小传输时延,避免了调度延时和失真。  相似文献   

15.
在对最佳任务调度下的Web数据进行优化聚类的过程中,容易出现原始数据损失的情况,导致传统数据优化聚类算法,由于忽略初始数据,无法有效实现Web数据优化聚类。提出一种基于粒子群优化的最佳任务调度下Web数据优化聚类算法,依据任务价值密度以及执行紧迫性,塑造动态优先级,通过适应度函数对分类计划进行评价,给出类间距与类内距计算公式,对相关参数和各粒子的位置以及速度向量进行初始化操作;求出粒子的适应度;求出粒子个体最优与群最优;依据粒子群优化算法的位置以及速度对当前位置和速度进行更新;通过K-means算法对EHCF进行聚类,直至全部Web数据聚类完成。仿真实验结果表明,所提方法在Web数据优化聚类上具有很高的优越性。  相似文献   

16.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

17.
基于融合基础架构的新一代数据中心,提出一种基于融合特征空间构架的云数据离散调度逼近算法,在对系统节点进行数据采集任务分配的基础上,研究基于云计算的IAAS层基础设施自动化快速供应的技术方案,对云数据离散分配任务进行评价和估计,描述了云数据采集和特征空间融合架构方法,构建云数据采集和特征空间融合机制,进行融合特征空间构架下的数据离散调度逼近算法改进设计。研究结果表明,该方法实现云数据离散调度的压缩性能很稳定,有效节约了任务执行时间,云数据离散调度逼近的收敛步数较少,收敛性好,展示了较强的实用性和优越性,为云计算的顶层设计PAAS与SAAS提供技术平台支持。  相似文献   

18.
提出一种基于自相关匹配滤波和云间相似程度特征提取的云资源调度数据融合算法。设计了基于云资源调度的云计算海量数据处理平台,构建数据融合预处理模型,在云资源调度系统中,设计自相关匹配滤波器,得到融合特征分簇重构空间,对特征进行模式匹配,得到后置处理滤波器的系统函数,实现了对云资源调度自相关匹配数据融合算法的改进。仿真实验表明,该算法能高精度、高平稳地实现云资源调度数据的融合,对云滴数的要求极低,数据处理效果较好,云资源调度执行任务数、云资源调度总任务完成时间、用户满意度等指标优于传统方法,展示了较好的应用价值。  相似文献   

19.
大数据环境下资源负荷短期预测时间跨度计算是提高大数据资源调度和数据集成的基础。通过对大数据环境下资源负荷短期预测时间跨度的准确估计,提高资源负荷的预测性能。提出一种基于非线性差分相点融合估计的资源负荷短期预测时间跨度估计算法。构建大数据环境下资源负荷模型,基于非线性差分相点融合估计的资源负荷短期预测时间跨度估计,进行非线性差分相点融合,进行全网拓扑信息激励传播均衡设计,通过频繁的切换来进行网络选区,将时间划分为连续区间,重新分配大数据环境下的时间跨度,最后得到基于线性差智能群辨识的资源短期预测时间跨度估计算法改进。仿真结果表明,该算法具有较好的时间跨度估计性能,提高了大数据环境下的资源负荷预测精度,具有较小的任务调度路径延时和能耗损失,为提高云平台的资源利用效率提供基础,展示了较好的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号