FASTQ格式文件压缩研究开题报告
2021-03-11 00:18:53
1. 研究目的与意义(文献综述)
1) 研究背景
下一代测序(ngs)以其无以伦比的通量、扩展性和速度,让研究人员以前所未有的水平研究生物系统,其发展极大地促进了基因组分析、遗传病诊断、食品安全等领域的研究。当今复杂的基因组学研究问题需要的信息深度已超过传统dna测序技术的能力。下一代测序填补了这一空白,并成为解决这些问题的日常研究工具。
下一代测序技术在改革基因组研究的同时,也带来了巨大的挑战,其中之一就是测序数据的经济性存储。下一代测序数据容量的增长速度远远超过了存储成本降低和网络带宽增加的速度,由于其庞大的数据大小,存储和传输原始数据显示是不可行的。因此研究人员致力于对原始数据进行处理以解决存储困难和传输缓慢的问题。
2. 研究的基本内容与方案
本次设计的主题为fastq文件压缩算法的研究,其中:
1) 主要内容:针对无损fastq文件压缩算法lfqc进行优化处理;
2) 研究目标:分析fastq文件格式,对比其他先进fastq压缩算法,在尽量保证原始压缩算法的压缩率不降低的情况下,对lfqc算法进行压缩时间上的优化;
3. 研究计划与安排
2017/1/14-2017/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;
2017/2/23-2017/4/30:系统架构,程序设计与开发、系统测试与完善;
2017/5/1-2017/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1]asnani,h.et al. (2012) lossy compression of quality values via rate distortion theory.
[2] bonfield,j.k. and mahoney,m.v. (2013) compression offastq and sam format sequencing
data. plos one, 8, e59190.