首页 理论教育 RNA世界假说的意义:探索早期细胞复制细节

RNA世界假说的意义:探索早期细胞复制细节

时间:2024-01-18 理论教育 版权反馈
【摘要】:RNA世界假说那么早期的自复制体长什么样子呢?因此,至少在现代细胞中,RNA是DNA上的遗传信息与构成细胞的蛋白质之间的关键媒介。RNA世界假说RNA world hypothesis原始的化学合成过程制造出了同时具有基因和酶的功能的RNA分子,最初的复制过程产生出许多变异体,这些不同的变异体互相竞争,在分子层面展开优胜劣汰。RNA世界假说逐渐为人所知。一旦引入自我复制及自然选择,一条你争我赶的道路便在RNA世界中架了起来,一直通向最早的活细胞。

RNA世界假说的意义:探索早期细胞复制细节

RNA世界假说

那么早期的自复制体长什么样子呢?它们又是如何运转的呢?最早的自复制体如今已无一幸存,大概是因为比起更加适应环境的后代,它们在竞争中落败,以至灭绝。关于这些自复制体的性质,现在的大部分说法都是基于经验猜测。其中有一种方法是从现存最简单的生命形式进行逆推,构想出一种更简单的自复制体——这种自复制体结构极简单,可以作为几十亿年前地球上所有生命的始祖。

可问题的关键在于,从活细胞中分解出结构简单的自复制体是不可能的,因为细胞中没有任何一个部分能够完成自我复制。DNA基因无法自我复制,那是DNA聚合酶的工作。同理,酶也无法自我复制,它们需要通过DNA和RNA链先进行编码。

在本章中,RNA将扮演一个重要的角色,所以有必要先回忆一下什么是RNA及RNA的功能。RNA算是DNA的表亲,结构比DNA更简单,与DNA的双螺旋不同,RNA以单链螺旋的形式存在。除此之外,RNA和比它更加著名的表亲DNA差不多具有相同的遗传信息编码能力——只是缺少一条互补的备份信息链而已。而且,像DNA一样,RNA上的遗传信息也由四种不同的遗传字母写成。因此,基因不仅可以通过DNA进行编码,还可以通过RNA进行编码。确实,许多病毒的基因组就是RNA而非DNA,比如流感病毒。但对像细菌动物植物细胞一样的活细胞来说,RNA的角色与DNA截然不同:DNA编写的遗传信息会先通过第6章中提到的基因读取过程转录为RNA,然后,与相对笨重且几乎静止不动的DNA染色体不同,短小精悍的RNA链可以在细胞内自由穿梭,携带着从染色体上复制到的遗传信息到达蛋白质合成器。在这里,RNA序列被读取并翻译为氨基酸序列,进而合成蛋白质(如各种酶类)。因此,至少在现代细胞中,RNA是DNA上的遗传信息与构成细胞的蛋白质之间的关键媒介。

现在我们回到生命起源的问题上来。虽然一个活细胞可以整体算作一个自复制的主体,但它的各个组成部分却不是,就像一个女人可以作为一个自复制体(还需要一点男士的“帮助”),但她的心或肝却不是。这就为逆推过程造成障碍,使由现代复杂细胞生命反推结构简化的非细胞生命变得困难。换句话说,问题就变成了:究竟是哪个先出现?是DNA基因,是RNA,还是酶?如果是DNA或RNA先出现,是什么制造了它们?如果是酶先出现,它又是由什么编码的?

RNA世界假说

RNA world hypothesis

原始的化学合成过程制造出了同时具有基因和酶的功能的RNA分子,最初的复制过程产生出许多变异体,这些不同的变异体互相竞争,在分子层面展开优胜劣汰。随着时间的推移,这些RNA复制体上添加了蛋白质来提供复制的效率,并由此产生了DNA和第一个活细胞。

美国生化学家托马斯·切赫(Thomas Cech)提出了一种可能的答案。他于1982年发现,除了能够编码遗传信息,某些RNA分子还能承担酶的工作,具有催化反应的功能。因为这项研究成果,切赫和西德尼·奥尔特曼(Sidney Altman)一起分享了1989年的诺贝尔化学奖。有催化功能的RNA分子叫作核酶(ribozymes)。最早的核酶发现于微小的四膜虫(tetrahymena)基因中。四膜虫是一种单细胞生物,属于原生动物,常见于淡水池塘。但自发现以来,科学家们发现,所有的活细胞中都有核酶的身影。核酶的发现很快为解决“鸡生蛋还是蛋生鸡”式的生命起源谜题提供了曙光。RNA世界假说(RNA world hypothesis)逐渐为人所知。该假说认为,原始的化学合成过程制造出了RNA分子,而这种RNA分子同时具有基因和酶的功能,可以像DNA一样编码自身的结构,又能像酶一样利用“原始汤”中的生化物质进行自我复制。最初的复制过程非常粗糙,产生出许多变异体,这些不同的变异体互相竞争,在分子层面展开达尔文式的优胜劣汰。随着时间的推移,这些RNA复制体上添加了蛋白质来提高复制的效率,并由此产生了DNA和第一个活细胞。

在DNA和细胞出现以前,世界属于自复制RNA分子——这个想法几乎已经成为研究生命起源的基本信条。目前已证明,只要是自复制分子能发生的关键反应,核酶都可以实现。比如,一种核酶可以将两个RNA分子结合在一起,而另一种核酶可以将两者分开,还有一些核酶能复制短的RNA碱基链(只有几个碱基的长度)。从这些简单的活动中,我们可以看出,若有一种更复杂的核酶便足以催化自我复制所必需的整套反应。一旦引入自我复制及自然选择,一条你争我赶的道路便在RNA世界中架了起来,一直通向最早的活细胞。

然而,这个情景也存在几个问题。虽然核酶可以催化简单的生化反应,核酶的自我复制却是一个更为错综复杂的过程,涉及识别自身的碱基序列、识别环境中相同的化学物质、按正确的序列组装这些化学物质以完成复制等。对于生活在细胞内的某些蛋白质来说,尽管这里条件优越,周围满是合适的生化原料,但完成自我复制依然是一项难以完成的任务。在混乱而焦糊的“原始汤”中艰难求生的核酶要想达成这一成就,其难度可想而知。迄今为止,还从未有人发现或合成能完成这一复杂任务的核酶,即使在实验室条件下也没有。

此外,一个更为基本的问题是,在“原始汤”中,RNA分子本身是如何生成的呢?RNA分子由三个部分组成:编码遗传信息的RNA碱基(与编码DNA遗传信息的DNA碱基类似)、一个磷酸基团和一个叫作核糖的单糖。虽然已经成功地设计出一些可行的化学反应,能利用“原始汤”中的原料合成RNA碱基或磷酸基团,但最可靠的合成核糖的反应会产生大量的其他糖类,而目前并没有已知的非生物机制可以自行产出核糖。而且,即使造出了核糖,将三个部分正确拼接在一起,本身又是一项非常困难的任务。将形态合适的RNA组件放在一起时,这三个部分总是随意结合,然后不可避免地变成原始“焦糊”。化学家们通过利用结构特殊的碱基来回避这个问题,这些碱基的化学基团经过修饰,可以避免多余的副反应——但这其实是作弊,况且,“激活”的(或者说经过修饰的)碱基,比起原本的RNA碱基更不可能在原始条件下形成。(www.xing528.com)

不过,化学家确实能够用简单的化学物质合成RNA碱基,只是需要经过一系列复杂的化学反应,且每一步反应都需要精心控制,得到的产品要经过分离提纯才能进入下一步反应。苏格兰化学家格雷厄姆·凯恩斯-史密斯(Graham Cairns-Smith)估计,由“原始汤”中可能存在的简单有机化合物合成RNA碱基,需要约140步反应。每一步至少需要避免六种副反应。这就让整个合成过程可以更加形象:你可以把每个分子想象成一个分子骰子,每一步就像掷一次骰子,掷出点数6代表产出了正确的产物,而其他点数意味着得到了错误的产物。因此,任何起始分子最终反应成为RNA的概率就像连续140次掷出了点数6一样。

当然,化学家可以通过精心控制每一步反应来提高反应成功的概率。不过,在生命出现以前的世界里,只能靠机会。或许太阳恰到好处地升起,蒸干了泥火山周围的一小滩化学物质?又或许泥火山喷发,向小水滩添加了水和一点硫,创造出了另一组化合物?还有可能是闪电风暴搅拌了混合物,用电能刺激加速更多的化学变化?这样的例子不胜枚举,但可以估计的是,如果只靠偶然性,这140步必要的反应都能在六种可能的产物中得到正确产物的概率是1/6140,即大约1/10109。为了能够通过纯粹的随机过程获得制造出RNA的概率,“原始汤”中至少要有如此数量级的起始反应分子。但是,10109比整个可见宇宙中全部基本粒子的总和(约1080)还要大得多。按照伊苏古岩显示的时间,从地球形成到生命出现的几百万年中,地球上显然没有足够的分子,也没有足够的时间来制造出数量显著的RNA。

然而,假设确实通过某些依然不为人知的化学过程合成了数量显著的RNA,我们必须还要克服一个同样棘手的问题——将四种不同的RNA碱基(与编码DNA密码的四个不同字母A、G、C、T类似)按照正确的序列串联形成可以自我复制的核酶。大多数核酶是至少有100个碱基的RNA链。由于链上每个碱基位点一定要有四种碱基之一,因此长度为100个碱基的RNA链就有4100种不同的排列方式。你觉得随机乱堆的RNA碱基又有多大的可能恰好沿着长链以正确的序列排成自我复制的核酶呢?

既然我们和这些大数字玩得饶有兴趣,那不妨继续下去。4100条100个碱基长的RNA链总共的质量大约为1050千克。为了以合理的机会得到一个所有碱基正确排列的自复制体,这大概就是我们所需的所有RNA链的总数。然而,请注意,据估计整个银河系的质量只有约1042千克。显然,我们不能纯粹依靠机会。

当然,在4100种排列中,可能有不止一种方式能使长为100个碱基的RNA链成为自复制体。满足条件的情况可能会很多,甚至有数万亿种可能。又或许自复制RNA其实相当常见,只要100万个分子就有机会形成一个自复制体。这个论证的问题在于,这只不过是一个论证。尽管有许多尝试,但还没有人能制造出哪怕一个能自我复制的RNA、DNA或蛋白质,也没有人在自然中观察到纯粹的自复制体。想到“自我复制”多么具有挑战性,这样的结果也就不足为奇了。在现代世界中,要完成如此功绩需要整个活细胞协调运作。那么,在数十亿年前,一个简单许多的系统也能完成这项任务吗?当然,它确实完成了,否则今天就不会有我们,我们也不会在这里思索这个问题。但是,在进化出细胞之前自我复制究竟如何完成?这个问题依然扑朔迷离。

鉴于在生物系统中发现自复制体确实很困难,我们或许可以通过思考另一个更为普遍的问题得到些灵感:在任意系统中进行自我复制到底有多难?现代科技为我们提供了许多能复制东西的机器,比如复印机电子计算机,还有3D打印机。那这些设备能进行自我复制吗?最接近这一目标的设备可能要数像RepRap一样的3D打印机了。RepRap在英文中是“快速复制原型机”的缩写。这种3D打印原型机,由英国巴斯大学阿德里安·鲍耶(Adrian Bowyer)发明,它能打印自己的零件。然后,这些零件又可以组装成一台新的RepRap 3D打印机。

其实也不尽然。这台机器只能打印塑料,但机身框架和大部分电子元器件却是由金属制成的。因此,它只能复制自己的塑料部分。此外,要想造出一台新的打印机,还需要人工将塑料零件和其他部件组装在一起。设计者的愿景很好,想要让能自我复制的RepRap打印机(及其他几款相似的打印机)免费为每个人服务。但截至笔者写作本书的时候,我们距离造出真正的自复制机器还有很长的路要走。

因此,如果寻找自复制机器不能真正帮助我们回答自我复制到底有多难的问题,我们可以先彻底跳出物质世界,去电子计算机中探索这一问题。在电子计算机中,混乱而难以合成的化学物质由数码世界中简单的基本构成单位所取代,也就是只能赋值1或0的比特。一个字节的数据,由8个比特组成,在计算机编码中可以表示文本中的一个字母,也可以大致等价于遗传密码的单位:一个DNA或RNA碱基。现在我们提问了:在所有可能的字节串中,能在计算机中自我复制的字节有多常见?

要回答这个问题我们有特别的优势,因为自我复制的字节串其实相当常见,就是我们熟知的电脑病毒。电脑病毒是相对较短的计算机程序,通过“怂恿”计算机的CPU大量复制自己来感染我们的电脑。之后,这些电脑病毒会钻进我们的电子邮件,通过电子邮件来感染我们朋友或同事的电脑。因此,如果我们把计算机内存看作一种数码的“原始汤”,那么电脑病毒就可以被视为电子版的原始自复制体。

Tinba病毒是最简单的电脑病毒,只有20千字节(即20kb),比起大多数计算机程序来说,可谓相当短小。但在2012年,Tinba病毒竟成功地攻击了大型银行的计算机,潜伏进银行电脑的浏览器,窃取登录数据。显然,这是一种令人望而生畏的自复制体。虽然20千字节对一个电脑程序来说可能很短,但它依然是一串相当长的数码信息,按8比特是1个字节计算,20千字节就对应了16万比特的信息。因为每个比特可能是两种状态之一(0或1),我们能很容易地算出随机产生一条特定的二进制数字串的概率。比如,生成一条特定的3比特数字链,如111,其概率为1/2×1/2×1/2,或1/23。遵从同样的数学逻辑,要想得到一条像Tinba病毒一样拥有16万比特的特殊数字链,其概率为1/2160 000。这个小到难以想象的数字告诉我们,Tinba病毒的出现不可能只是偶然。

类比我们对RNA分子的猜测,可能有许多自我复制的代码比Tinba病毒还要简单得多,而且纯粹是偶然产生的。但如果真是这样,那每秒钟在互联网中流动的计算机代码何止无数,必然会随时不停地产生电脑病毒。其实,大部分代码不过是些1或0的序列,就像互联网上每秒钟下载的图片或电影。这些代码都有可能给我们的CPU下指令来执行像复制或删除这样的基本操作,但迄今为止,所有侵染我们计算机的电脑病毒,都有明显的人类设计的痕迹。就我们所知,每天在全世界互联网中流动的海量信息从未自发地产生过一个电脑病毒。即使在非常方便复制的计算机环境内,自我复制都极其困难,而且就我们所知,从来没有自发地发生过。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈