基于纠删码的低存储开销二进制矢量编码存储方案设计
Design of Storage Scheme for Low Storage Overhead Binary Vector Coding Based on Erasure Codes
随着现代社会中互联网的高速发展和越来越广泛的应用,网络数据已经呈现出急速增长的趋势,大数据时代已经走上了舞台.一个巨大的问题也慢慢的走到人们面前:如何简单有效的存储和管理海量的数据.将数据和管理放在同一个系统中的传统的存储方式在面临即将到来的海量的数据已经应接不暇.且出现越来越多的问题,例如:存储系统的安全性能无法得到保证,可靠性也没有办法维持以及可扩展性比较低等.分布式存储系统的提出很好的使这方面的缺陷得到补救,且使得海量数据以分散的形式存储在网络系统中,这种方式的提出为眼下海量数据的存储提供了很大的方便,满足了其需求而且具有很强的稳定性.因此分布式存储系统逐渐成为了主流的存储系统,并且应用范围逐渐变得越来越大.分布式存储技术,顾名思义即将系统中的数据分散开来进行存储.而这一技术的实现主要利用网络中闲散的计算机和其他终端设备.同时存储系统的稳定性和安全性也通过在系统节点中增加存储冗余而得到保证.目前为已有的冗余策略有两种:基于复制的冗余策略和基于纠删码的冗余策略.在较大的存储系统中如果运用了基于复制的存储方式,由于基于复制的冗余策略本来就有很大的冗余,因此若将其应用到较大存储系统中则会加重冗余导致系统臃肿,性能变差.由于海量数据的产生较大规模的分布式存储系统越来越广泛应用,所以利用基于纠删码的存储方式来减少冗余使系统性能得到提升,降低了存储系统的存储开销,也提高了系统的可靠性.网络编码的存储方案被应用在分布式存储中以解决分布式存储中存在的可靠性以及可恢复性问题,网络编码在分布式存储中的实践和广泛的运用,对解决日后海量的数据存储问题有着重大意义.本文主要研究了基于纠删码的分布式存储系统中节点的存储开销问题,主要内容如下:1)(n,kk)CP-ZD(Combination Properity Zigzag Decodable)码,虽然具有编码复杂度低,计算开销也比较小,但是其存储开销相对来说比较大.为了解决这一问题,本文提出了一种单节点二包的低存储开销二进制矢量码的分布式存储方案,该方案同时满足CP-ZD性质.将2k=n(2
- 作者:
- 王津津
- 学位授予单位:
- 深圳大学
- 专业名称:
- 信息与通信工程
- 授予学位:
- 硕士
- 学位年度:
- 2018年
- 导师姓名:
- 代明军
- 中图分类号:
- TP333
- 关键词:
- 分布式存储系统;二进制矢量码;MDS;Zigzag
- Distributed storage system; binary vector code; MDS; Zigzag;