登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

生物大数据可视化JavaScript软件包毕业论文

 2021-03-15 20:13:55  

摘 要

随着二代测序技术的飞速发展和基因组重测序成本的不断降低,全基因组关联分析也得到了充分和快速的发展。然而,面对GWAS的海量且复杂的数据,传统的基于文本或者静态图片的可视化方案已经不能满足需求。生物大数据可视化在需要新的方法和理论的同时,还需要赋予更多的交互能力和数据表现能力。

基于此,本文从web可视化技术的基本理论出发,结合GWAS数据的特点和生物信息学意义,基于SVG和Canvas的技术提供了对GWAS数据的交互式可视化。并提出了相应的浏览器加速方案,以缓解浏览器假死问题。

本研究编写了基于BioJS的软件包,把充分和直观的可视化显示、交互式体验和按需加载为准则,告别传统的可视化方案,使得生命科学家能够把更多的精力集中在解决生物学问题和挖掘生命科学意义上。

关键词:GWAS,BioJS,HTML5,可视化

Abstract

With the rapid development of second-generation sequencing technology and the continuous reduction of genome re-sequencing costs, genome-wide association study has also been fully and rapidly developed. However, in the face of GWAS's massive and complex data, traditional visualization based on text or static images has been unable to meet the demand. Visualization of biometric data requires more interaction and data presentation as well as new approaches and theories.

Based on the basic theory of web visualization technology, this paper provides the interactive visualization of GWAS data based on the characteristics and bioinformatics significance of GWAS data with SVG and Canvas technology. And put forward the corresponding browser acceleration program to ease the browser suspended animation problem.

This study has been written on a BioJS-based software package that allows full and intuitive visualization, interactive experience, and on-demand loading to bid farewell to traditional visualization programs that enable life scientists to focus more on solving biological problems and dig out the life sciences.

Key Words:GWAS;BioJS;HTML5;visualization

目 录

第1章 绪论 2

1.1 研究背景及意义 2

1.2 国内外研究现状 2

1.3 课题研究内容 2

第2章 前端可视化理论 2

2.1 可视化技术 2

2.1.1 前端可视化技术探究 2

2.1.2 SVG与Canvas的抉择 2

2.2 图形加速策略 2

第3章 可视化实现 2

3.1 数据规格 2

3.2 数据稀释 2

3.3 图形设计与实现 2

3.3.1 曼哈顿图 2

3.3.2 LD Block图 2

3.3.3 包调用方式 2

第4章 系统评价与优化 2

4.1 兼容性测试 2

4.2 性能分析 2

4.3 网络优化 2

4.3.1压缩传输 2

4.3.2 合并请求 2

5 总结与展望 2

5.1 总结 2

5.2 展望 2

参考文献 2

致 谢 2

第1章 绪论

1.1 研究背景及意义

1985年,为了破解人类的全部遗传信息,解读“生命之书”,美国科学家率先提出人类基因组计划[12](Human Genome Project,HGP)。HGP是一次规模宏大、意义深远的生命科学探索,于1990年正式启动,由美国、英国、法国、德国、日本和我国科学家共同参与,对人类染色体中所包含的的30亿个碱基对组成的核苷酸序列进行测序。该计划耗资30亿美元,用时15年,最终得到测序数据,可谓是数据来之不易。

如今,随着高通量测序技术的诞生、发展和应用,测序速度越来越快,测序成本与第一代测序技术相比急剧下降。测序技术的发展速度已经超过了摩尔定律[1]。如图1.1所示,近年来,基因组测序成本都在不断下降。以人类基因组测序为例,高通量测序使得测序成本控制在一千美元以下,时间可以控制在数周。如此快速、低廉的测序技术,是一个巨大的进步,给生命科学研究带来了前所未有的机遇[14]

图 1.1 2001-2016年基因组测序成本下降趋势

GWAS[11](Genome-wide association study,全基因组关联分析)方法是将基因组中数以百万计的SNP(Single Nucleotide Ploymorphism,单核苷酸多态性)为分子遗传标记,进行全基因组水平的对照和相关性分析,来发现影响复杂性状发生的基因型的一种基因变异检测方法。高通量测序技术的快速发展带动了GWAS的发展,GWAS正成为精准医疗和农作物育种的重要手段。然而,GWAS的海量且复杂的数据,却为对其分析结果的解读带来了挑战。

传统的基于文本的展示模式已经无法满足我们从数据中提取价值的需要,生物大数据这种大规模的数据的分析和发现是一个难题,对于研究人员来说会是一个亟待解决的问题[14]。为了更加高效、方便、快速地理解数据,发现数据中所体现的信息,基于可视化的数据展示模式成为解决生命科学的迫切需求。同时,可视化需要以一种合理、友好的方式对数据添加必要的注释数据,以便发现数据之间所存在的关系,更好的对数据进行关联,方便生物研究员浏览和查询与之关联的数据。

1.2 国内外研究现状

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图