登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 电子信息类 > 电子信息工程 > 正文

基于Java的SNP数据显示程序设计与实现毕业论文

 2021-05-15 22:59:37  

摘 要

SNP,即单核苷酸多态性,表示一个核苷酸碱基变异而导致的核苷酸序列的多态性。当前的生物科学研究中,人类基因组计划的一个关键步骤即是对SNP的相关研究,它发展迅速而且具有极大的潜力。面对检测到的大量DNA序列、基因结构以及其他数据,将其以一种更为直观的形式展现在人们面前,例如表格,图形,网络等。这正是本论文研究的主要内容,一个基于Java的SNP数据显示程序。

在此次的设计中,主要是利用Java编程语言作为技术平台,在此基础上完成生物样本数据的读取,处理和显示三个主要步骤。而这其中的数据处理部分还涉及到一些滤波算法的使用。

而在数据处理算法部分,则是数据滤波处理算法,本次的设计一共涉及到了四种比较常见的算法,分别是带通滤波滤波算法、平滑滤波算法、高斯滤波算法和中位值滤波算法。这四种滤波算法的做用不尽相同,适用于处理的数据也不完全一样,我们需要做的是根据实际的应用场景和实际的数据来选择合适的处理方案。

数据显示部分这是采用现有的较为成熟的JFreechart显示方案,它是Java平台上面的一个开放的图标绘制类库,可生成各式各样的图表,足够满足此次研究的需要。使用JFreechart,我们完成了SNP数据的读取,并在此基础上进行了相应部分数据的变换,例如计算拷贝数,进行数据归一化处理,取对数等,并以散点图、直方图、折线图的样式展现了出来。

关键字:SNP,生物序列,JFreechart,可视化

Abstract

SNP, single nucleotide polymorphism, which can present a variation and lead to the nucleotide sequence of nucleotide bases polymorphism.Current biology science research, the human genome project is a key step of SNP related research, it has developed rapidly and has great potential.Facing a large number of detected DNA sequences, gene structure, and other data, to show in the form of a more intuitive to show in front of people, such as tables, graphics, network, etc.This is the main content of this thesis research, a java-based SNP data display program.

In this design, mainly using the Java programming language as a technology platform, on the basis of the complete biological sample data read, process and display the three main steps.And the data processing section also involves the use of some filter algorithm.

And algorithm in the data processing part, it is data filtering processing algorithm, the design of the total involve four kinds of common algorithm, respectively is bandpass filter for filtering, smoothing filter, gauss filter and median filter algorithm.It is not the same in the four filtering algorithm,  the data is not exactly the same, we need to do is according to the actual data of actual application scenarios and to select the proper treatment scheme.

Data showing part used the existing relatively mature JFreechart display scheme, it is a Java platform above an open icon drawing class library, can generate all kinds of charts, enough to meet the needs of the study.Using JFreechart, we completed the SNP data read, and on this basis, the corresponding part of the data transformation, the calculation of copy number, for example, data normalization processing, the exponential, etc., and with a scatter diagram, histogram, the style of the line chart to show out.

Key Word: SNP,Biological sequences,JFreechart,Visualizatio

目 录

摘要 I

Abstract II

第一章 绪论 1

1.1研究的背景和意义 1

1.2国内外研究现状 1

1.3论文研究内容 2

1.3.1主要研究内容 2

1.3.2技术路线 3

1.4论文安排 4

第二章 生物学相关背景 5

2.1.染色体和DNA 5

2.2等位基因 5

2.3拷贝数 5

2.4单核苷酸多态性 5

2.5相关SNP研究现状 5

第三章 算法部分 6

3.1数据预处理算法 6

3.1.1带通滤波算法 6

3.1.2平滑滤波算法 7

3.1.3高斯滤波算法 7

3.1.4中位值滤波算法 8

3.2本章小结 10

第四章 数据显示的实现 11

4.1整体实现流程 11

4.2数据读取 11

4.3数据处理和变换 15

4.3.1数据变换 15

4.3.2计算CN 15

4.3.3计算tBAF 16

4.3.4计算nBAF 17

4.3.5计算nLogR 18

4.3.6计算tLogR 19

4.4数据显示 20

4.4.1散点图 20

4.4.2直方图 25

4.4.3折线图 27

4.5本章小结 29

第五章 总结 30

致谢 31

参考文献 32

第一章 绪论

1.1研究的背景和意义

为什么生物体之间会存在着差异?原因正是由于这是由基因决定的,基因控制着生物体的生长发育,控制着生命活动,要想认清生物的本质,就必须首先彻底了解生物的基因[[1]]。20世纪,生命科学正在飞速发展,人们从各个层次了解了生命的物质基础,实验技术快速发展。分子生物学研究不断深入,这使得人们能够在分子级别层面进行所有生物系统中的生物大分子的鉴定和测量[[2]]。从定义上来说,基因组包含了一个物种的所有基因组成,不仅包括功能基因序列,也包括基因之间的相互作用的调控机制所具有的遗传信息[[3]]。

人类基因组计划开启了药物基因组学、分子生物学、蛋白质组学等新的研究趋向。其中,利用基因序列数据的检测与分析,寻找个体间基因序列的差异性,对于复杂疾病的相关性研究上也扮演着重要的角色[[4]]。

您需要先支付 50元 才能查看全部内容!立即支付

微信号:bysjorg

Copyright © 2010-2022 毕业论文网 站点地图