典型微生物辅因子网络模型的构建与应用文献综述
2020-04-13 14:56:45
文 献 综 述
0引言
以往一系列的代谢工程改造策略,包括减弱反馈抑制、消除竞争途径、过量表达主要合成途径、提升细胞转运能力、引入全新代谢途径以修饰微生物代谢途径中的某一个或几个基因,不一定能获得预期的代谢通量增大或降低的效果[1]。出现这一状况的原因在于缺乏对微生物代谢网络全局调控和表达调控网络的充分理解。
随着基因组及其相关技术的发展,越来越多的生物完成了全基因组测序,许多模式物种的基因组规模代谢网络模型以及其他组学数据的不断涌现,为解析、调控和优化工业微生物生产性能提供了新的眼界。将这些海量、分散的组学数据与实际工业生产建立联系,从全局规模上深刻认识和高效、定向调控微生物生理功能,从系统生物学角度发展提高工业生物过程效能的策略,是进一步提高微生物制造过程效率的关键。
1.基因组规模代谢网络模型
在全基因组测序的基础上对基因组数据进行注释分析后,按照功能将其分成不同的类别,其中与细胞内部反应有关的基因、代谢物与反应途径构成了纵横交错的代谢网络,即基因组尺度代谢(genome scale metabolic model, GSMM)[2]-[5]。基因组规模代谢网络模型通过整合基因组学,文献组学,蛋白组学等组学数据,建立由基因-蛋白质(酶)-生化反应关系组成关联的特定微生物代谢网络,是从全局规模上深刻认识的高效、定向调控工业微生物生理功能的重要平台。
2.基因组规模代谢网络模型构建
2.1 GSMM构建所需数据库与软件
基因组尺度代谢网络模型构建过程是建立基因-蛋白质-生化反应之间联系的过程[6][7],涉及到基因组、蛋白质和酶、中间代谢产物、生化反应、代谢途径等诸多方面的数据,因此GSMM的构建首先需要获取必要的数据[8]。构建过程所需的数据库和工具主要分为以下几类[9][10]:1) 基因组数据库,主要包括EMBL数据库 (由欧洲生物信息学研究所管理)、GenBank(由美国国家生物技术信息中心管理)和DDBJ(由日本三岛信息生物学中心管理)。2) 蛋白质数据库,收集了蛋白质序列、分类、功能、结构域、蛋白质模体(Motif)、亚细胞定位等信息,而酶学数据库则收集了酶的分类、功能、催化反应、标准命名以及酶相关特性,如温度、Km值、pH等以及与之相关的事实文献。3) 代谢物数据库。GSMM构建中所涉及的中间代谢产物的信息可以从ChEBI、PubChem和KEGG等3个数据库中获得。4) 代谢途径数据库,最为典型的代谢途径数据库是EcoCyc Ontology和KEGG。5) 文献事实数据库[11]。高通量技术手段的不断发展带来了实验数据以指数方式增长,为构建完善网络提供了更为丰富的信息。6) 模型构建的软件:构建过程使用的软件主要是Matlab、Illustrator或CellDesig。
图2 代谢网络模型重构的一般流程图