高通量数据分析系统的设计与实现任务书
2020-03-29 12:52:05
1. 毕业设计(论文)主要内容:
随着二代测序技术的发展与深入,测序数据爆炸性增长,各种针对测序数据的生物分析流程也随之产生。生物分析流程的好坏直接决定了相关企业或科研院所的分析效率和能力。目前主流生物分析流程存在以下问题:1)分析过程非透明化,无法确保分析流程的完整性和准确性。2)许多并行化,分布式,云计算技术并没有应用到流程中,导致整体的分析效率不高。3)分析流程复杂性过高,目前很多分析都是在命令行下进行,对操作人员有更高的技术要求。
本课题的任务就是基于上述存在的问题利用Nextflow工具实现一个分布式的,有用户操作界面,可实时追踪分析过程的生物分析流程操作平台。2. 毕业设计(论文)主要任务及要求
需要完成的主要工作
为实现目标,需要完成的工作主要包括:
-
利用nextflow框架将已有的分析流程自动化、并行化。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!3. 毕业设计(论文)完成任务的计划与安排
(1)2018/1/14—2018/3/5:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2018/3/6—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2018/5/1—2018/5/25:撰写及修改毕业论文;
(4)2018/5/26—2018/6/6:准备答辩。4. 主要参考文献
[1] 敏俐,关善辉,陆祖宏. 染色质免疫沉淀试验中基因组DNA超声破碎条件优化策略[J]. 生物技术通报,2010(05):121-125 140.
[2] Di Tommaso P,Chatzou M, Floden E W, et al. Nextflow enables reproducible computationalworkflows[J]. Nature Biotechnology, 2017, 35(4): 316-319
[3] Garcia R, Valente M T. Object-Business ProcessMapping Frameworks: Abstractions, Architecture, andImplementation[C]//Enterprise Distributed Object Computing Conference (EDOC),2014 IEEE 18th International. IEEE, 2014: 160-169.剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付