首页 理论教育 从病毒到细菌:基因组结构和基因编码的特点

从病毒到细菌:基因组结构和基因编码的特点

时间:2023-05-15 理论教育 版权反馈
【摘要】:病毒基因组小,基因数少。细菌的DNA大部都是编码蛋白的功能基因,而基因组的结构基因无重叠现象。基因组中结构基因多为单拷贝,但编码rRNA的基因通常是多拷贝,以适应细菌核糖体快速组装及蛋白质快速合成。基因组含有37个基因,其中13个为蛋白基因,主要编码与呼吸链代谢相关的蛋白质或酶。

从病毒到细菌:基因组结构和基因编码的特点

四、基因组

1.概念

基因组(genome)是指生物体有合成功能的各类细胞的全套遗传物质,载有遗传信息的DNA大分子或RNA组装成染色体(或染色质),每条染色体存在成千上万的不同基因。在遗传学中对基因组的科学定义是指一个单倍体细胞核中、一个细胞器中(如线粒体叶绿体)或一个病毒中所含的全部DNA(或RNA)分子的总称。如果具体所指,则可分为核基因组、线粒体基因组、叶绿体基因组及病毒基因组。换言之,基因组也就是一个生物体所有基因的总和,是构建一个生物体及其所有生物活性的总蓝图。由此,一门收集、研究及破译所有生物的基因组为研究目的和内容的新型学科——基因组学也应运而生。

各类生物基因组DNA量是不变的,但细菌有所例外,因此,物种不同,染色体数目不同,其基因数量不等,少至几个,多则5万~10万个。如大肠杆菌染色体数目1个,DNA含量4.2×106bp;小鼠染色体数目40个,DNA含量1.4×108bp;人染色体数目46,DNA含量3.2×109bp。基因组是基因概念的深入与发展,它更能全面反映生物体的遗传信息与功能。

2.原核生物

病毒的基因组由DNA或RNA组成,每种病毒只有一种核酸。病毒基因组小,基因数少。病毒基因DNA序列中功能相关的蛋白质基因或rRNA基因,常集中在基因组的一个或几个特定部位,形成一个功能单元或转录单元。病毒除反转录基因组有两个拷贝体,其他基因组中每个基因只有一个拷贝。再者,病毒带有重叠基因,即一段DNA片段可以编码2~3种蛋白分子,这种结构可使较小的基因携带更多的遗传信息。

细菌染色质基因由环状双链组成,结构基因序列是连续排列的,无内含子,在转录后不需要加工修饰。细菌的DNA大部都是编码蛋白的功能基因,而基因组的结构基因无重叠现象。基因组中结构基因多为单拷贝,但编码rRNA的基因通常是多拷贝,以适应细菌核糖体快速组装及蛋白质快速合成。细菌除了在类核中含有较大环状染色质DNA外,胞质中还含有小的双键环状DNA分子结构,称为质粒。质粒是细菌的特殊结构,含有4×106~100×106bp,具有良好的自我复制和调控系统。质粒不是细菌生命活动所必需的,但其编码的性状大多数对细菌起保作用,使细菌获得有利于生存的特性。

3.真核生物

真核生物庞大,DNA结构复杂,表达调控多样。整个基因组分布在细胞核内的多条染色体中,细胞除细胞核DNA之外,线粒体也含有极少量的DNA,它们有其自身的功能。真核细胞基因的DNA序列由编码序列和非编码序列两部分构成。编码序列被非编序列隔开,是不连续的。基因结构有4个区域,包括编码区、前导区、尾部区和调控区。编码序列的外显子(extron),即基因编码表达多肽链的部分,而内含子(intron)为非编码序列,又称插入序列。每个外显子和内含子接头区都有一段高度保守的一致序列,即由内含子5′末端大多数是GT开始,3′末端大多是AG结束序列,称为GT—AG法则,是普遍存在于真核基因中DNA剪接的识别信号。调控区的启动子具有促进启动转录过程的功能,与基因转录的起始、调节及转录激活功能密切相关,而增强子不能启动基因的转录,但有增强转录的作用。终止子具有转录终止的功能。终止子是转录终止点之前的一段回文序列,约7~20bp,它将受到有序的调控而实现转录的终止。

4.人类基因组(www.xing528.com)

人类基因组包括细胞核内的基因组及细胞质内线粒体基因组两类。图4-6是人类基因组框架示意图。

img34

图4-6 人类基因框架

细胞核基因组含2000兆个碱基对,而线粒体基因组只有16600个碱基对,相差很大,但人类细胞核基因组的全部遗传信息都编码在线状的DNA分子上。每个单位基因组约含3.2×109bp。人类基因的平均长度为1~1.5kb,所以基因组足以编码1.5×106种蛋白质,但实际上编码蛋白质的结构基因只不过3万个,仅占总基因组的2%~3%。其余的DNA序列包括基质之间的间隔区,基因内插入序列,重复序列等。重复序列是指一个基因组中具有很多拷贝的序列。

人类线粒体DNA(mtDNA)是独立于细胞核染色体的基因组,能自主复制,由16569个bp组成,每个mtDNA分子为环状双链DNA分子。外环为重链,内环为轻链(图4-7)。基因组含有37个基因,其中13个为蛋白基因,主要编码与呼吸链代谢相关的蛋白质或酶。人类线粒体的基因排列紧密,无内含子序列,mtDNA为母系遗传。当然,人类基因组的理论技术为《人类基因图谱》构建和后基因研究奠定了基础。

img35

图4-7 人类线粒体基因组

H:重链,L:轻链,N01-N06:基因编码NADH脱氢酶亚单位,C01-C03:基因编细胞色素C氧化酶亚单位,1-3CYB:基因编码细胞色素B(引自孙汶生:基因工程学,2004)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈