这是有史以来,人类所制作的最重要且最神奇的地图
-美国克林顿总统
地图与其所代表的地域,是不一样的东西。
-柯齐普斯基(AlfredKorzybski)
追寻人类的过去
我搭乘的出租车挤在午后车阵中,顺着密歇根湖的弧形冰冻湖岸穿梭前进我的右手边是拥有世界数一数二高楼的城市,以钢铁与玻璃建造的大厦从伊禾IJ诺草原拔地而起,直人云霄,好似一度沿着湖岸蔓生草木的现代转世版本。芝加哥是一座拥有将近三百万人口的繁荣大都会,其欧黑尔机场一度是全世界最繁忙的机场(如今则落到第二名),一天有超过十九万人进出,今天还包括我在内。这座不断发展的城市以其活力及向前看的文化自豪,桑德堡(CarlSandburg)称之为“工具制造厂”与“小麦堆积仓”乍看之下,这里似乎不是寻找过去的最佳所在。
不过,带我回到过去的,是密歇根湖,而且是回到很久以前、连湖都还不存在的时候。事实上,密歇根湖是地球经历过最大几次冰河期之一所遗留下来的痕迹。在上一回的冰河期,劳伦台德冰层(Laurentideicesheet)从北加拿大沿着密苏里河一路往南伸展,最远到达印第安纳波里市;其右翼覆盖了今日的纽约州,甚至还溢人大西洋。当该冰层在一万年前左右融化时,融水汇人了包括密歇根湖在内的五大湖。我从出租车里朝窗外望去,看着强风在广袤的冰冻湖面上呼啸,感觉上历史正在重演;我不觉想象,冰河期的景观大概也就是这样。
那不只是空想而已,我这一辈子者卩在研究过去,试图重建历史。我从小就迷恋历史,对任何有关古埃及、希腊与罗马、中东伟大帝国以及中世纪欧洲的书籍,都一视同仁地生吞活剥。
到了高中念生物学时,我开始思考比上述更古老、以地质年代为基准的历史,想象其中上场演出的演员;于是我把生命的历史加人了我对笔述历史的热爱之中。上大学后,我决定研究写在我们自身历史之书的纪录人类的DNA。
我感兴趣的领域称作“族群遗传学”,是研究生物族群的遗传基因组成,利用生物的DNA来解读其中随时间而改变的纪录。该领域的源起,是研究人员试图将人类祖先如何迁徙、古代人类族群如何融合与分裂,以及在漫长的岁月中如何形成多样化的蛛丝马迹给组合起来。简言之,那可是真正古老的历史。
这项追寻再度把我带来了这里,也就是我从机场搭车前往的目的地芝加哥大学。我上一回造访芝加哥大学是1989年2月,迄今已有18年之久,当时我正在考虑到那里去念研究所。
上回来也是湖水冰冻时节,在清晨华氏个位数字的气温下走在芝大校园里参加会议,对我决定前往较为温暖的麻州剑桥念研究所,有5P么一点小影n向。不论我的决定如何,芝大从过去到现在都是一所杰出的大学,在许多领域,从经济学、文学到物理学不等,都拥有出色的研究员及思想家。这回我就是前来拜访其中一位。
我在斯坦福大学从事博士后研究时,普理察(JonathanPritchard)是那里的研究生,我到现在还记得他早期在我们小组书报讨论时做的报告。他拥有的数学家头脑,加上对遗传变化过程的深刻了解,使他成为我们组上真正宝贵的资产。后来我在牛津大学进修时与他又有过短暂的交会,但之后多年却失去了联系。虽然如此,我一直密切注意他在科学期刊发表的论文,也正是其中的一篇让我再度与他取得联络,以便讨论他的发现。
这篇发表在《生物科学公共图书馆》(PLoSBiology)知名网络期刊的文章,描述了普理察团队发明的一种新方法,可检视人类基因组受到的天择影响。天择是达尔文所描述的力量,创造出像眼睛、耳朵,以及绝大多数人类特征里真正有用的精美适应构造。达尔文告诉我们,对某个生物有用的小改变,可让该生物在永不止歇的生命竞赛中取得某种优势,而有更大的机会存活及繁衍。所有这些受天择拣选的特征,最终都可以追溯其源头至DNA的组成层面,因此在基因当中找寻人之所以为人的,是理的。
在基因层面寻找天择的痕迹已有目当长远的历史,可回溯到比华森(JamesWatson)与克里克(FrancisCrick)解开DNA构造的20世纪50年代初还要更久远之前。早在20世纪初叶,有一批帮忙将族群遗传学建立为现代科学的先驱科学家,像是从俄国移民到美国的杜布蓝斯基(TheodosiusDobzhansky),就热衷于寻找只能用上达尔文天择这种看似神奇的力量来解释的遗传变化。只不过在能够直接研究DNA定序之前的年代,研究人员是经由观察果蝇染色体构造上的大幅变化来进行的。
(果蝇一直是遗传学家喜爱的模型生物,主要原因是它们的唾液腺细胞拥有巨大的染色体,可在DNA定序之前的年代让人研究遗传变异的形态。)他们虽然在果蝇身上发现了之前天择作用的证据,但对于观察所得的终极原因却仍然未知。
一旦我们晓得遗传变异的终极根源是在DNA,同时也解开了DNA的构造,进而发展出决定DNA双螺旋化学组成序列的方法之后(我这可是把超过五十年的研究给一笔带过),族群遗传学家就开始直接检视DNA的序列。在早些年(也不过25年前左右),由于受到技术的限制,他们只能检视基因组上少数几个小区域(基因组是一个人所有基因组成的总和),试图从中寻求天择的证据,结果经常是徒劳无功。
一直要到20世纪90年代末,人类基因组计划接近完成,以及重大的技术突破从中衍生,族群遗传学家才终于能够重新审视近一世纪前、让杜布蓝斯基与同行念兹在兹的问题有没有可能在DNA的层面找到天择的证据?或是更有意思的问题
有没有可能弄清楚这一切为什么会发生?
基因珠链上的时尚珠粒
我让出租车停在芝加哥大学书店前,付过车资下车后,打量了一下周遭景观。我发现环绕四面的都是建于19世纪末、芝加哥蓬勃建设初期的哥特式宏伟建筑。芝加哥大学于1890年由石油大王洛克菲勒捐款成立,一开始就有意模效古老欧洲学术殿堂的传统,因此让我有回到牛津大学高耸的尖塔建筑之间、赶着去给大学部学生上讨论课的感觉。只不过我这回来芝加哥大学造访的地点,是一栋年轻得多的建筑。
康明斯生命科学中心(CummingsLifeScienceCenter)建于1970年,那是因为华森与克里克解开DNA的构造之后,生物学研究正进行一场革命性的变化,因此新建筑提供了从事这波先进生物学研究的科学家所需空间。就当年而言,该砖楼建筑充满新鲜的现代感,甚至让人感到有些冷酷。我这次来是找普理察讨论问题的,他正使用遗传学上最先进的技术,来探讨人类的历史。就我前来讨论的主题而言,这栋建筑夹杂在校园里较古老建筑当中的情况,倒是满切题的。
我在该大楼的高层找到了普理察的研究室。他给我泡了杯茶,我们随意闲聊着。他热中长跑,拥有马拉松选手的专注与瘦削外貌;他似乎有些惊讶!我从大老远跑来就只为了同他聊天。我问了问他从牛津大学转到芝加哥大学的经过、私人生活(他书桌上方挂了幅儿子的画)!以及在三十七岁的“早熟”年纪就拿到全球知名大学终身制的感想。他听了笑了起来!对我说他的日子过得确实不错;一如我认得的许多拥有数学天赋的人,他对自己的智力信心十足。接着,我们就进人正题,谈到我这次造访的目的。
我想要同他说点行话;更确切地说,我想要听他谈谈他那篇重要论文里的发现。他和同事发表于《生物科学公共图书馆》的文章里,描述了一种新方法,可在人类基因组里侦测天择的痕迹。该方法使用了“人类基因组单体型图”(HapMap),也就是人类基因组里称作单体型(haplotype)构造的数据总汇。
要了解其中奥秘,我们得先多谈一点科学。
构成人类所有基因组的长条DNA链,又细分成好些较短的构造,也就是一条条的染色体。人类一共有23对染色体,其中包含了两万三千个左右的基因,指挥我们身体的一切运作。
这些基因携带了制造消化酵素、凝血蛋白,甚至决定你耳屎形态的编码,也就是造成每个独特个体所有特征的讯息。染色体是线形的DNA构造,由四种称作核苷酸的化学分子A、C、G和T排列组合而成。这四种核苷酸在人类染色体上的序列,好比AGCCTAGG等,携带了我基因组的编码讯息,也决定了每个基因在身体里所做的工作。核苷酸在染色体上的排列,就像串成珠链的珠子一般,也像排成一列的音乐家,每个都演奏着交响曲当中的一部分,而整首交响曲就是我们这个人。我们拥有的每一对染色体,一条来自母亲,另一条则来自父亲。
不过这些音乐珠粒从父母亲传给你的时候,进行了一些有趣的过程,它就像扑克牌洗牌那样进行了重组,也就是说将你父母原本所拥有的线状珠链做了部分的混合。没错,你父母在形成精子与卵子时,其中的染色体进行了基因讯息的交换,也就是将一对线状的染色体打断,进行交换后再接合,因此形成了全新版本的染色体后再遗传给你。
这就是你与家族中其他成员不会完全相同的原因之一,但我们还不完全清楚为什么会发生这种事。目前的最佳解释是:
人类每一代染色体上的音乐珠粒都有新的组合,可能是件好事,可让你我的子女在时代发生改变时,其DNA乐团能演奏出全新的曲调。我们可以想想在气候出现大幅变迁的年代,生物必须进行迅速的演化以为因应。再者,这种染色体的重组现象在动物与植物界都普遍可见,显然是有很好的存在理由。
看到这里,有些读者可能会感到奇怪既然染色体是成对存在,那么重组又会造成什么改变呢?它们还是相同珠链的复制版本,重组只是在两条新染色体上产生了相同的组合,不是吗”事实上,新组合之所以出现,是因为成对染色体里的每一条都是另一条染色体稍有瑕疵的版本。当染色体从一代传给下一代时,都会在每一代新个体的细胞里进行复制。虽说这个复制过程控制严密,也有校对机希作可保证复制后的珠链与原始的相同,但偶尔还是会出错,好比绿色的珠粒给置换成红色的珠粒。这种出错的几率并不高,在每一世代的每一条染色体上只会有几次;只不过一旦发生了,就会一代一代地传下去。
这种差错,遗传学家称之为突变。突变给基因池里引进了额外的变异,这些改变随着时间而逐渐累积,以至于多到在成对的染色体中,每隔一千个珠粒就可能出现一个变异。因此,每条遗传给子女的染色体者卩是父母染色体的重组版本,其中的重组情形可由各种珠粒的排列模式看出。这理论听起来似乎很复杂,但只要把它想成是珠链上的珠子,理解起来就容易多了。
HapMap计划所做的事,就是估算这些珠粒在不同的人类族群当中重组的情况。经由检视非洲人、欧洲人以及亚洲人的基因,该计划就能推算出珠粒没有遭到更动的珠链平均长度为何。这个长度与该族群存在的时间、随时间而改变的平均族群大小,以及其他有助于决定珠链上何处出现重组的因子,具有函数相关。所有这些相关后头的数学可以相当复杂,但重点是这些在珠链上出现重组的位置,有个平均长度。随着时间过去以及经过许多世代的重组,每个族群的珠链结构都产生了某种“识别标志”,也就是可用来区分不同族群的珠链排列形态;那是因为住在同一区域的人要比住在地球其他区域的人,有更多的。
普理察和同事发展出一套统计方法,可找出染色体上看起来没有出现多少重组的位置。换句话说,他在一群人的染色体珠链上找到一段段看起来非常近似的段落,就好比一群人当中每一个者卩戴着一条形式独特的项链,只不过在每个人的项链当中有一大区段几乎完全相同。这种情况代表着在许多人当中有某种力量存在,使得有一长段的珠链以整作11方式进行了世代遗传,好似某种珠粒排列成了时尚配饰,在他们穿戴的项链当中流行起来。譬如,某人看到别人戴的项链当中有一段珠粒的特别排列方式是他喜欢的,就复制到自己的项链里,于是这种时尚品位造成了某种珠粒排列方式的广泛流行;不要多久,就有许多人带着这种项链了。
当然啦,我们不可能从一个人的外表看到他染色体的排列方式,也不可能把一段别人的染色体插5U你的染色体里;因此对这种基因的“时尚追求”,我们得寻求其他的解释。由于染色体携带的是基因,不是珠粒,因此我们可以推测,某人染色体上的某个特殊排列形态提供了某种演化的优势,造成该排列方式在族群中广泛分布。这个发生在大自然的过程不是追求时尚,而是“天择”;这个让发现者)9世纪的达尔文)兴奋不已的作用力,使得生物在经过许多世代后,产生高度适应环境的品种来。
譬如像与其他手指相对的拇指、彩色视觉、让人惊叹的大脑等,都源自几百万年前人类DNA上头出现的微小改变,经过天择的拣选,而有今日的模样。
有许多人共享的染色体珠链段落,在基因编码上必定有些特别的改变,提供个体某种演化优势,因此使得携带者更容易存活,而将其DNA传给子代,其中自然也包括那个流行的区段。针对这种遗传方式的研究,可提供我们一窥过往的管道,看看我们的基因组在先前的天择历程中如何遭到形塑。我们从现代人DNA里发现的线索披沙拣金,就有可能找到发生在许多世代之前事件的证据,就好比法医侦探从现场留下的蛛丝马迹中,拼凑出犯罪的细节。这也正是普理察和他的同事发表在《生物科学公共图书馆》的文章里所做的事。
我请普理察为我解释他使用的方法,于是他在办公室的白板上用不同颜色的笔画出几条并行线,说明他和同事如何扫描HapMap里的数据,以找寻拥有相同结构的区段。他们使用一种叫作“整合单体型成绩”(integratedhaplotypescore)的数字,来修正人类基因组当中重组形态的区域变异。那是因为基因组里有些部分,在所有的人类族群当中似乎都拥有目当类似的长幅区段,而那只不过是由该区域DNA的物理结构所造成(不尽然是受天择所青睐的一段珠链),而其他经历更多重组的区段则会在族群中出现更多变异。