域名频道资讯站
我们一直在努力制造惊吓

一颗精子=750MB的信息!且行且珍惜!

此内容来源于外媒,微信公众号云头条翻译

 一颗精子=750MB的信息!且行且珍惜!

有一天我与一位计算机科学出身的朋友聊了会天。后来聊到了我的研究,冒出了下面这个问题:人类基因组中存储了多少数字信息?我开始绞尽脑汁,不过意识到根本就答不出来。于是我决定好好算一下,估计我们的基因组中存储了多少信息。

 一颗精子=750MB的信息!且行且珍惜!

算算基因组的信息存储容量

人类基因组中含有生物体的全部基因信息,作为DNA序列存储在23对染色体中(22对常染色体和1对X或Y性染色体),染色体是由DNA和蛋白质组成的结构。一个DNA分子由组成标志性的双螺旋(twisted ladder)的两条单链组成,而双螺旋的基干(由糖和磷酸盐分子组成)由含氮碱基连接起来。DNA由4种不同的碱基组成:腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)和鸟嘌呤(G)。这些碱基总是以腺嘌呤连接胸腺嘧啶、胞嘧啶连接鸟嘌呤的方式相配对。这些配对生成4种可能的不同碱基对:A-T、T-A、G-C和C-G。单倍体人类基因组(只含有每个染色体的1个副本)由大约30亿个分成23对染色体的这些碱基对组成。一个人经遗传得到两组基因组(从父母那里得到),因此得到两组染色体,共46对染色体,代表二倍体基因组,含有6×109个碱基对。

将基因组与计算机数据存储进行比较

为了在计算机上表示DNA序列,我们需要能够以二进制格式(0和1)表示所有4种可能的碱基对。0和1这些比特通常组合成一个较大的单位,最小的单位是“字节”,表示8个比特。我们可以使用最少2个比特来表示每个碱基对,因而有4种不同的比特组合(00、01、10和11)。每2个比特组合表示一个DNA碱基对。一个字节(或8比特)可以表示4个DNA碱基对。为了用字节表示整个二倍体人类基因组,我们可以执行下列计算:

6×109个碱基对/二倍体基因组×1个字节/4个碱基对= 1.5×109字节或1.5吉字节,相当于2张CD的存储量!或小得足以将3组不同的基因组装在一张标准的DVD上!

整个有机体的数据存储

某个有趣的问题可能随之而来。比如说,人体内存储了多少兆字节的基因数据?为了简单起见,不妨忽略微生物组(生活在我们身体中的所有非人类细胞),只关注组成我们身体的细胞。估计人体中细胞的数量在10万亿到100万亿之间。姑且将这100万亿个细胞作为普遍接受的估计值。因此,鉴于每个二倍体细胞含有1.5GB的数据(这个值非常近似,因为我只算了二倍体细胞,忽略了我们体内的单倍体精子和卵子细胞),所以人体中存储的大致数据量是:

1.5吉字节×100万亿细胞=150万亿吉字节或150×1012×109字节=150泽字节(1021)!

性信息交换

同样,人类繁殖过程中交换了多少基因数据呢?男人中的每个精子细胞都是异形配子的、单倍体的,这意味着它只含有两条性染色体中的一条(X或Y),而且只有一组22对常染色体。因此,每个精子含有约30亿碱基的基因信息,表示750兆字节的数字信息。人一次射出的精液平均含有约1.8亿个精子细胞。所以,那就是180×106单倍体细胞×750兆字节/单倍体细胞=135×109兆字节=135000兆兆字节!在此基础上更进一步,13500兆兆字节传输时,只有一个精子细胞会与一个卵子结合,只使用了750兆字节的数据,与来自卵子的另一750兆字节的数据相结合。因此,在有性繁殖的过程中传送的数据中实际上99.9999…%被丢失了……剩余那一点可怜的信息会不会带来任何成果就看是不是好好培养了。

算出上述数字后,有人可能会问一大堆其他好奇的问题。你有没有想过我们生物有机体的数据容量?细胞分裂过程中的数据传输速率是多少?配子结合过程中的数据传输速率是多少?人类淋巴细胞在血液中循环时的数据传输速率是多少?每天因细胞凋亡而受到破坏的数据有多少?每天生成多少数据?这与通过光纤传输数据的速率相比如何?

来自微博@左耳朵耗子的评论:

 一颗精子=750MB的信息!且行且珍惜!

来源丨外媒,云头条编译

本文章素材来自互联网

赞(0)
分享到: 更多 (0)

中国专业的网站域名及网站空间提供商

买域名买空间