共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
3.
HBase原有负载均衡算法策略是保证每个Region Server的Region数目相同。但每个Region的访问并不均等,可能造成负载不均衡情况,产生热点数据,影响请求响应效率。部分Region会成为热点,导致一些Region Server负载过重。为提高HBase数据库整体性能,将数据热度因素考虑在内,使用预测方法设计HBase负载均衡算法,把预测数据的热度作为Region Server负载。实验表明,优化后的负载均衡算法可在一定程度上提高HBase数据库性能。 相似文献
4.
为提高压力管道数据存储性能,改善数据存储效率,增强压力管道后期的可维护性,构建一种基于Hadoop的压力管道数据存储系统.该系统利用HDFS分布式存储框架建立压力管道数据的存储模型,采用MapReduce对压力管道海量数据进行分析和处理,从而完成数据写入HBase数据库的低延迟响应.在实验中,采用压力管道数据对MySQL、Oracle、Spark SQL、MongoDB和Rasdaman进行性能对比.结果表明,在相同数据量的情况下,系统运行时间更短,占用内存更少,其在存储压力管道海量数据方面具有较好的优越性. 相似文献
5.
健康大数据已被纳入国家大数据战略布局,如何能够收集有效的健康数据,构建高性能、高可靠性、低成本和具有良好可扩展性的健康大数据平台至关重要。传统的单纯利用Hadoop、HBase无法满足复杂的业务需求和实时查询的要求,同时性能方面也存在一些问题。分析了HBase的底层原理,对HBase的读写性能进行优化。借助Phoenix提供的SQL接口来操控HBase,可方便对集群和数据进行管理。Phoenix针对HBase也提出了一系列优化方案。利用HBase和Phoenix的特性构建高性能的健康大数据平台。实验结果表明,优化后的健康大数据系统具有更好的读写性能,能够更好地满足大数据发展需求。 相似文献
6.
在大数据时代,数据高速增长,对数据仓库管理方法和技术提出了全新挑战,为实现仓储资源优化配置,提高资源使用效率,首次把数据半衰期运用于数据仓库分级存储。传统固定阈值转存策略存在存储资源配置不合理的问题,利用半衰期分级存储策略,对每个数据对象进行计算分析后转存,采用MPP数据仓库和Hadoop构建混合数据仓库存储架构,解决了大数据背景下的数据存储与分析,实现了数据仓库管理方法和数据存储架构的创新。实际验证发现,数据半衰期转存策略优于固定阈值转存策略,证明数据半衰期在数据仓库的管理中有显著应用价值。 相似文献
7.
8.
旅行时间计算是智能交通系统研究的重要内容,准确的旅行时间计算结果可以为交通管控部门提供决策支持,缓解交通拥堵情况。近年来,随着监测水平的提高,交通监测数据呈现海量增长趋势。传统的关系型数据库应对海量数据时存在高并发读写和扩展性不足等瓶颈。为解决智能交通因数据规模过大带来的存储和查询问题,提出了一种基于HBase的交通旅行时间计算方法,设计了面向查询优化的行键策略,并在此基础上提出了单时段及多时段旅行时间计算方法。实验表明,该计算方法与传统的基于Oracle的算法相比,时间效率提高2~3倍,并且有较高的读写性能及良好的可扩展性。 相似文献
9.
王静蕾 《商丘职业技术学院学报》2014,(2):18-20
云计算一直是产业界、学术界关注的焦点问题,目前它已从“概念期”逐渐走向“实践期”。文章选择云计算平台- Hadoop作为研究基础,通过对其结构特点的概述,从4个核心模块之一 HDFS为切入点,引入分布式数据库Hbase 。最后,重点论述了 HBase的数据模型和实现思想,为进一步探索互联网大数据处理奠定了理论基础。 相似文献
10.
随着城市的发展,传统方式存储与处理不断增多的交通数据暴露出诸多问题。为此,设计并实现了一套基于Hadoop的交通数据存储和处理平台。该平台采用HBase数据库存储数据,Mapreduce实现数据并行处理,Web端展示数据。实验结果证实,该平台在数据存取和数据处理性能方面都优于传统处理方式。 相似文献
11.
远程教育资源具有数据量大,增长迅速的特点,对这些海量数据资源进行低成本存储和基于内容的高效检索,是远程教育云平台建设面临的一大难题。本文基于Hadoop设计了一套对远程教育海量资源进行存储和检索的方法,解决了这个难题。 相似文献
12.
13.
张悦 《深圳职业技术学院学报》2015,(1):18-22
基于时间-内存平衡(Time-Memory Trade-Off)技术的彩虹表已经成为破解MD5哈希(HASH)密码的有效手段,但由于彩虹表文件庞大,彩虹表的生成、存储和分析使用都十分复杂和耗时.本文提出使用HBase作为彩虹表存储和分析使用的技术方案,实验验证了该方案的可行性和有效性. 相似文献
14.
随着手机和可穿戴设备的蓬勃发展,越来越多的人运用健康平台记录运动数据,在方便应用的同时也带来了安全和隐私问题。为解决健康平台存在的各种隐患,采用以下应对措施:在数据采集端,有统一的健康监测数据接入协议,采用不同的规则对用户数据进行安全处理;在数据发布端,按照发布规则,对共享的健康信息进行保护,对平台不同用户给予不同权限;在存储端,对各种健康数据,都有查询和使用的详细记载。通过以上措施,极大改善了用户的个人隐私问题。 相似文献
15.
16.
17.
18.
19.
陈海蕊 《濮阳教育学院学报》2014,(4):146-148
太阳风是从恒星上层大气射出的超声速等离子体带电粒子流。为了正确高效地存储太阳风粒子海量数据,使之结构化并为后续研究所用,本文通过研究云存储架构模型及其关键技术,构建太阳风数据私有云存储模型,设计出一种基于云存储的太阳风数据资源管理系统SWDCS。基于云存储模型的SWDCS系统能够较好地解决太阳风粒子海量数据的高效存储问题,为进一步研究和建立太阳风粒子系统仿真体系提供了物质基础。 相似文献
20.
作为深受开发者青睐的主流大数据平台,Hadoop在数据的处理、分析及应用上拥有着其他平台不可比拟的优势。在介绍了大数据定义和Hadoop生态系统架构的基础上,分别对基于Hadoop提出的大数据存储、分析、管理、安全及应用等关键问题的解决方案进行了研究和综述。最后,对基于Hadoop的大数据平台的研究和应用发展方向进行了展望。 相似文献