基因祖源分析:被用于娱乐的入门型基因检测服务。请看右下角文字

基因检测用于遗传分析,主要应用于:

  • 身分鉴识;
  • 亲子关系鉴定;
  • 追溯祖源。

DNA是每个人独有的生命密码,全世界60几亿人当中没有任两个人的DNA排序是完全相同的(同卵双胞胎例外),因此能够透过DNA基因分析,做到身份鉴识/亲子关系鉴定和追溯祖源的各项目的。其中最常见的身份鉴识和亲子鉴定,从早期的限制酶片段多型性或称DNA指纹方法,演进成为短相连重复序列系统,至今已成为高敏感度、高个化性、完全数位化、适合电脑建档与比对之世界通用人身鉴别系统,血缘关系与身分鉴定正确率能达到99.99%以上,提供司法机关洗冤白谤或确认嫌疑人之完整能力。

前两个应用早已被公众熟知。DNA鉴定确定犯罪嫌疑人,DNA分析确定某个人真实身份在影视作品里早已科普完成。连隔壁老王是不是与自家娃娃有关系都可以通过弄老王的一根头发做一下DNA鉴定来确定。

亲子关系可以精确无误地确定本来引起社会伦理学家的种种担忧,因为这打破了女性对子女血缘确切成分的垄断权。但是事实证明:人类社会的稳定性非常可靠,基因检测没有造成大面积的社会问题,也没有很多人去鉴定自家娃娃的基因来源。

mtDNA成为研究人类史的重要工具

线粒体夏娃学说

在人类细胞的细胞质中,存在着一种“线粒体DNA”(mtDNA)的物质。受孕产生的胚胎细胞的细胞质中,几乎全盘地继承了来自母亲的mtDNA,父亲的精子只是向胚胎细胞核中贡献了23条染色体,而对细胞质中的mtDNA没有影响。因此,子女的mtDNA只是来自母方,他们的mtDNA与母亲的几乎完全相同。因此,任何人的”mtDNA”,与其母亲、外祖母、外曾祖母、外高祖母等,没有差异或差异很小。

1981年,英国剑桥大学首次测定和发布了一个普通欧洲人的线粒体DNA序列,这就是著名的“剑桥序列”。这16569个DNA字符代码组成的圆环状“字符代码串”,成了全世界各个族群的医学判定标准。因此,它不但是分子医学,也是分子人类学的重要里程碑。
1987年,美国加州大学威尔逊教授,在权威期刊《自然》上发表文章,称他们从不同人种的mtDNA研究结果表明,现今全人类的mtDNA,有高度类同的特征,说明所有人类都是一位女性的后裔。威尔逊等人说:“我们可以将20万年前这位幸运的女性称为夏娃,她的世系一直延续至今。”

人类男性的Y染色体来源于父亲,所以男性的Y染色体遗传也保持稳定性,分子遗传学家也提出了“同一个老老老祖父”的概念。

追溯到同一个老祖母、追溯到同一个老祖父似乎不符合遗传树的样子,难道每个人不是应该有2个“父母”、4个“祖父母”、8个“曾祖父母”……么?

如此推论下去也许几十代以上,我们的祖辈数量就变成了天文数字,很快就会超过地球上曾经存在过的人类总数。这是不可能的,毕竟远古时期整个地球的人类族群规模有限。人类遗传树孤立地看是树状,总体看是网状。可以追溯到同一个节点,并不代表只有这一个节点。

染色体夏娃理论存在较大争议,很多学者坚决反对,拿出证据反驳。对普通大众,我们知道有这样一回事即可,静等学术界出现占领导地位的结论再说。

互联网催生的基因遗传分析

23andme公司的网页截屏

随着1000美元基因组测序时代的到来
(2000年的测序成本约为一亿美元每基因组),个人DNA检测服务也开始走入了发达国家的百姓家中,23andMe作为各路风投的宠儿,个人DNA检测服务中的战斗机,更是推出$99美元的基因检测服务。

23andMe曾经有多种不同级别的检测服务可供选择,但是由于美国政府的限制,现在只有99美元的最基础检测。在2013年23andMe被美国FDA禁止出具了带有诊断性的健康报告,现在23andMe只能给予关于用户祖先的分析报告。

在23andme做基因遗传分析超级简单,只需要:注册、收包裹寄口水、等报告三个步骤即可。尽管23andme经常出现被叫停的传闻,但其创造的99美元遗传分析服务还是非常有趣的。通过遗传分析,用户可以知道:

  • 血统成分,非常详尽,甚至可以知道几百年前融入过哪些族群血统;
  • 追溯非常久远,比如是否还有尼安德特人的遗传残留;
  • 通过基因寻亲,找到与用户基因最相近的人在哪里,用斑斓的图片在地图上显示出来。

吐口水给23andme

23andme的其他分析服务没有被禁之前,用户可以通过报告了解到自己获得某些疾病的概率。这类疾病概率报告的好处十分明显,一个比较有名的例子就是安吉丽娜茱莉在了解到自己得乳腺癌得概率高达87%之后,采取了切除乳腺得预防手段。

然而,这类报告也有各种潜在得风险,假如一个未成年儿童在家长不知情的情况下通过23andMe了解到了自己得脑癌得概率有80%,于是对未来失去信心,甚至投河自尽,那么这是谁的错呢?监管层是否要对此负责呢?于是在相关的管理办法没有完善之前,FDA只能禁止23andMe的这类健康报告。

遗传分析现在看来仅仅具有娱乐属性,具有奢侈品“贵而无用”的基本特征。不过23andme这样的公司将这些趣味分析变得不再昂贵。很多阴谋论者一直警惕自己种族的基因被潜在敌对势力掌握,基因数据无疑属于隐私信息,这种隐私与银行账号比,需要做到何种程度的保密,现在尚无定论。

遗传分析对于公众也许是奢侈的、贵而无用。但对于生物医学和分子生物学家、分子人类学家却不是如此,掌握大量的遗传分析数据后,可以做出大量的统计学研究结果。

PS:刚才浏览了一下23andme网站,199美元的服务又出现了

mtDNA背景资料

人的基因有数万个,绝大部分位于细胞核的染色体上,但是有极少数(确切地说是37个)位于细胞质的线粒体中。每个细胞中都有成千上万个线粒体,它们是细胞的“呼吸器官”,为细胞活动提供能量。
在精子生成过程中,绝大多数的线粒体都被去除了,只保留极少数的线粒体提供精子运动的能量。在受精时,精子细胞核进入卵子,与卵子细胞核融合,而精子中残余的线粒体则被挡在外头,不进入卵子。因此,下一代的细胞核基因,一半来自精子,一半来自卵子,但线粒体基因则全部来自卵子。也就是说,线粒体基因属于母系遗传的。
在生成精子、卵子的过程中,细胞核的基因会发生重组,把原来的排列都打乱了。但是线粒体的基因却不会重组,因此它的传递是相当忠实的。不过,并不存在百分之百的完全忠实的遗传,在线粒体基因的传递过程中,就象细胞核的基因一样,还是会发生罕见的基因突变,改变了基因序列。随着时间的推移,线粒体基因积累的突变越来越多,后代个体之间线粒体基因序列的差异也就越大。一般说来,两位个体之间线粒体基因序列差别越大,表明他们与共同祖先分离的时间越长,亲缘越疏,反之则越近。
这样,通过比较现在各个个体之间线粒体基因序列的差异,我们就可以比较他们的亲缘关系是怎么样的,然后根据基因的突变率,就可以算出这些个体的共同祖先生活在什么时候。时间越向前推移,突变越多,但是如果越往后追溯,则突变越少,最后必然要达到一点,即不存在现存的所有突变,而只有一种原型。这时候我们就说找到了现在所有人的线粒体的共同祖先了。通过追踪线粒体基因的谱系,发现在大约14万年前出现了交叉点,表明现存所有人的线粒体基因都传自14万年前的一名女性。她被形象地称为“线粒体夏娃”。
细胞核中决定男性性别的Y染色体也是单性遗传的,只不过它是父系遗传,由父亲传给儿子。通过比较各个个体之间Y染色体序列的差异,我们也可以计算出现在所有人的Y染色体都来自大约6万年前的一名男性。他被称为“Y染色体亚当”。
所谓“夏娃”、“亚当”本来只是一种比喻说法,但是一般人都误会了这个发现,以为它意味着在当时只存在一个女人或一个男人。原教旨基督徒甚至把这个发现当成了《圣经》的亚当、夏娃的故事真实可靠的证明。当然也有人很奇怪“亚当”和“夏娃”生活的年代怎么会相距好几万年。
这当然是无稽之谈。这个发现,绝不意味着14万年前只有一个女人或6万年前只有一个男人。恰恰相反,当时肯定同时生活着许多女人和许多男人,只不过她们的线粒体基因和他们的Y染色体基因没有遗传到现在而已。但是她们或他们遗传下了其他的基因。“线粒体夏娃”和“Y染色体亚当”除了遗传下线粒体和Y染色体,很可能没有其他基因一直遗传到现在。
不仅是线粒体基因或Y染色体才存在这种情形。我们随便拿一个基因,只要把它们的突变过程追溯得足够远,总能找到一个共同祖先,只不过,这些祖先生活的时间可能各不相同。这些祖先甚至未必是人,有的可能要追溯到人进化出来之前的某个动物。
可以说,这是统计学上的一个假象,原因就在于越往前追溯,每个人的祖先越多:你有两个父母,四个祖父母,八个曾祖父母……如果这么翻倍下去,几十代后就会成了个天文数字。但是每一代人的人数又是固定的,实际上越早期人数会越少,所以,只要追溯得足够远,当时以及在那以前生活着的、到现在还有后代的所有的人就都会成了你的祖先,依次类推,人人如此。所以,如果我们以全世界的人所共有的某项特征为据(比如线粒体基因、Y染色体或某种基因)往前追溯,最后全世界的人总能找到一个共同的祖宗,但是这绝不意味着当时就没有其他的人了,更不意味着这个老祖宗的遗传贡献就比其他的同时代的人都大。
用姓的遗传打个比方就很容易理解了。我们拿着方氏家谱一代代往前数,最后找到了方家始祖,但是这绝不意味着方家的所有遗传都只来自方氏始祖夫妇,在方家几千年的演变中,不断地加入了外家族的血液,而这些人的血缘,都可以追溯到与方氏始祖同时期的人身上,这些人中,有的对方家血缘的贡献,说不定还超过了方氏始祖。只不过,当我们以“方”姓为标志来研究方家血缘时,把这些来自外姓的血缘都忽略掉了。


5 遗传、基因、DNA&RNA、基因图谱、光怪陆离的蛋白质
5.7 遗传分析:奢侈的、贵而无用

相关文章