可交互生物数据可视化插件的设计与实现文献综述
2020-04-14 22:19:43
随着高通量测序技术的不断进步及广泛应用,产生了大量的生物数据[1],通过生物信息学技术来理解蕴含于数据中的生物学知识是当前生物技术发展的迫切需求。这些生物数据类型复杂、数量庞大,这个问题在基因方面尤为突出:随着二代测序技术的飞速发展和基因组重测序成本的不断降低,全基因组关联分析也得到了充分和快速的发展。
而如今,随着第二代测序技术的诞生、发展和应用,测序速度越来越快,测序成本与第一代测序技术相比急剧下降。测序技术的发展速度已经超过了摩尔定律[2]。近年来,基因组测序成本都在不断下降。以人类基因组测序为例,高通量测序使得测序成本控制在一千美元以下,时间可以控制在数周。如此快速、低廉的测序技术,是一个巨大的进步,给生命科学研究带来了前所未有的机遇。虽然测序成本已经不能限制生命科学的发展,但是对海量数据分析的难度还是生命科学发展的桎梏。
传统的基于文本的数据处理和展示模式不利于清楚地表达其中的复杂关系。生物信息可视化技术可以将难以理解的抽象符号信息转化为更直观的图像和模型,是有效理解生物数据的不可或缺的手段[3][4]。对生物数据进行良好且直观的展示可以揭示数据内在的错综复杂的关系,让研究人员可以对复杂的数据进行多角度观察,为生物数据的分析和生物信息的挖掘提供了便利。然而,面对基因的海量且复杂的数据,传统的基于文本或者静态图片的可视化方案已经不能满足需求[5]。生物大数据可视化在需要新的方法和理论的同时,还需要赋予图表更多的交互能力和数据表现能力。
基于以上背景,我们拟定在原来数据可视化技术的基础上增加图表的交互能力,这样可以使生物工作人员更加高效、方便、快速地理解数据,同时可视化需要以一种合理、友好的方式对数据添加必要的注释数据,以便发现数据之间所存在的关系,更好的对数据进行关联,方便生物研究员浏览和查询与之关联的数据。
目前现成的前端可视化插件并没有对于基因高度定制的。因此我们只能通过重新调用封装这些库函数来达到我们对于交互的追求。以上插件中,D3.js因为其高度定制性和极强的交互能力最能满足我们的需求,但是由于其代码繁复,不利于前端开发人员的快速开发,开发时间成本高,这是亟待解决的问题。
{title}2. 研究的基本内容与方案
{title}目标:
1)利用前端技术设计出一个可交互的数据可视化工具
2)根据指定数据类型制定合理的可视化方案
3)利用前端技术实现部分R语言的图表