一种低开销的并行重复数据删除算法 |
| |
引用本文: | 江程,朱锐,张芳,明华强,钟涵.一种低开销的并行重复数据删除算法[J].教育技术导刊,2015,14(8):96-99. |
| |
作者姓名: | 江程 朱锐 张芳 明华强 钟涵 |
| |
作者单位: | 武汉工程大学 计算机科学与工程学院,湖北 武汉 430205 |
| |
摘 要: | 重复数据删除是数据备份系统中的一种重要数据压缩技术。随着备份数据量的逐渐增多,对备份数据中重复数据块进行识别和删除可大大减少数据备份系统中的存储空间和数据传输带宽,提高数据备份系统的效率。当前,随着多核和并行处理技术的发展,重删技术并行实现已经成为研究热点。随着并行规模的扩大,在并行重删技术中,多线程在并行数据块索引查询中的一致性开销成为影响并行查重性能的主要因素。为减少查询线程间的一致性开销,结合目前主流的并行重删技术,提出一种基于数据后缀的并行重删算法。通过对实际数据集的测试,相对于传统并行重删算法,该方法能有效提高系统性能1.5~2倍。
|
关 键 词: | 重复数据删除 多线程 并行 |
A Parallel Deduplication Method with Low Overhead |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|