Capfs分布式文件系统多副本读写优化研究开题报告
2021-02-26 11:19:42
1. 研究目的与意义(文献综述)
本地文件系统因容量、性能等诸多自身限制已无法满足日益增长的存储需求,取而代之的是分布式文件系统的广泛应用与普及。在大规模分布式文件系统中,数据的安全性和可靠性极其重要,它关系到文件系统是否可用,因此提高系统的扩展性和容错性是非常有必要的。
在大规模分布式文件系统中,数据的安全性和可靠性是非常重要的。为了保证分布式文件系统能够迅速和有效地恢复损坏的数据,一种可靠的解决方法就是在集群环境中存储服务设备的不同节点上保存数据的副本。一般而言,副本数越多数据的可靠性越高,然而过多的副本对存储资源是极大的浪费而且对网络带宽的开销也非常大。为了维护系统多个副本之间的一致性,在修改副本以及恢复副本时,必须要更新所有的副本,这将产生很大的带宽开销。不仅如此,由于存放文件的节点分布范围比较广,读取以及修改数据的延迟会很大,若副本的放置不合理将会严重的影响i/o效率,降低系统性能。对于副本中这些可靠性、高效性、一致性、负载均衡等问题,以往的副本机制大都只能顾及到其中的某一个方面。
副本可以为系统提供可靠性保证,然而副本的加入也会引发新的问题:众多副本如何管理;访问数据时如何选取并定位一个最合适的副本;如何在数据更新以及恢复时保持多个副本的一致性。这些都会给系统带来额外的开销,影响到系统的性能。
2. 研究的基本内容与方案
本毕业设计研究的基本内容是基于capfs分布式文件系统,解决副本读写的速度和一致性,实现capfs分布式文件系统副本读写的优化。
具体内容包括以下几个方面:
(1)分析capfs系统在对多副本进行读写时的流程;
3. 研究计划与安排
(1)2017/1/14—2017/1/22:查阅参考文献,明确选题;
(2)2017/1/23—2017/2/28:进一步阅读文献,完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
4. 参考文献(12篇以上)
[1] 张薇,马建峰.lpca一分布式存储中的数据分离算法[j].系统工程与电子技术,2007,29(3):454-458
[2] 刘翔,汪海玲.分布式存储中的一种数据放置策略[j].计算机与数字工程,2009,37(5):27-29
[3] 张维琪,闰瑾,边根庆.基于权值跳表的分布式数据定位策略与实现[j].西安邮电学院学报,2012,17(1):67-70