我的生物黑科技(校对)第82部分在线阅读
“确实太巧了。”
“不论科学还是历史,所有的巧合,都不是偶然,看似巧合,其实都必然有其内在的原因。”
“或许。”
程翔看着大屏幕上熟悉的双螺旋,“或许,在这些基因之中,我们可以找到些什么。”
心中有了想法,程翔立刻操作电脑,看到文件体积只有不到300M的工程文件忍不住皱了皱眉头。
“侯主任,我们能估算出盒子里DNA的重量吗?”
“可以,根据航天中心先前传输过来的概要数据,初步估算,盒子里所有的DNA重量大概在十千克左右,误差不超过正负千分之五。”候志洁快速答到。
“十千克!”听到这个重量,程翔再次看了看工程文件,看到那300M的文件眉头拧的紧皱。
“十千克重量的DNA,需要收集的基因序列信息太庞大了,不提检测设备速度有限,即便是能检测出来,要依靠电磁波将数据从火星传输到地球,也完全行不通。”
程翔皱着眉头说道。
候志洁听了表示赞同:“碱基对脱水后的平均分子量为614,方便计算可以估值为600,那么1克DNA上的碱基对大约会达到10的21次方这个数量级。”
“就算我们接下来不描述碱基对上的分子式,只传输碱基对标记过来,按照现在一小时300MB的速度,一个比特位代表一个碱基对的话,那就大约需要4.2乘以10的11次方个小时,也就是大约170亿天,将近五千万年。“
“所以,理论上,以现在的技术,根本不可能依靠电磁波将完整的数据传输过来。”
程翔点头同意,“这确实是个问题。不过,暂时来说我们心里有数就好,我们接下来先对手头上的这段信息先进行研究。”
“看看是否能看出点什么东西。如果能找到有价值的东西,那么到时候再做另外的打算。”
候志洁同意程翔的看法,目前,也只有这么做最合适不过,所以接着议题说道,“据我了解到的,航天中心部署在火星同步轨道的祝融四号卫星每小时带宽大概300MB,以我们的权限,紧急任务下,一天能申请下来的,应该可以达到每小时200MB。”
火星勘探,通讯资源永远是紧张的,能申请每天200MB,占据总带宽的三分之二,非常少见。
“一小时200MB,一天,就大概是2.5G左右。”
程翔点点头,“这个数据量初步研究应该够用了。“
“我们先开个短会,看看怎么着手吧。”
“好!”
经过一段时间的讨论,会议最终决定,从原有的团队中,分出一半的人手,投入到火星未知基因的研究过程中。
任务划分完毕后,时间已经凌晨三点。
但是,从众人的表情上,却看不到困倦的意思,一个个神色既激动,又凝重。
不过,该睡还得谁,研究,是一项长期的任务。
转眼,时间已经是第二天夜里。
航天中心那边已经在晚上八点左右,将今天收到的数据准时送到银河研究所。
硬盘数据大约2G左右,并没达到预估的2.5G,不是预估无法精确,而是,以现在的通信技术,在数千万乃至数亿公里之外进行通信,只能做到这样。
数据链路不会一直稳定,所以,能一天得到2G数据已经相当不错。
而从昨天开始接受数据开始测算,时间都不够24小时,能有2G数据,还是航天中心考虑到配速数据时间提前,所以临时抬高了今天分配的每小时带宽的原因,否则,即便是2G的数据量也别想达到。
回想十几年前,那个时候,火星同步轨道卫星还未部署,火星高空中继卫星更是想都别想。
那时只能依靠火星地面的信号发射装置进行通信,一个小时的传输速度不到100MB,并且因为星球自转原因,一天只能发送几个小时,比起那时候,现在的情况已经好上太多。
此时,夜里八点,程翔处理掉其他的日常工作后,听闻数据抵达,立刻赶到了地下九层。
等到程翔赶到时,候志洁已经在位置上等候。
“程所长,数据送到了。”
“按照我们的要求,这里面存放的数据,是49个小盒子里面,其中编号1-10号盒子里面基因的前200MB数据。”
“很好,给我来一份。”
“然后按照昨天的安排,将剩下的数据给各小组分配一下。”
“好。”
候志洁做事非常干脆,立刻将硬盘递给程翔。
程翔接过立刻坐下,硬盘熟练接入后,校验通过后,打开硬盘空间,立刻看到了熟悉的工程文件。
将工程文件拷贝到保密电脑后,程翔将硬盘还给了候志洁。
交还硬盘后,程翔立刻投入到工作中,双击,工程文件快速加载完毕。
熟悉的双螺旋结构顿时呈现到眼前,今天的数据,比起昨天来说,不光是数据量上大了十倍,更关键的是,今天从火星发送来的数据,已经略去了分子式的结构描述,直接以碱基对标记发送。
所以,眼前呈现的这条基因数据量,比起昨天,何止上浮了十倍。节约了每个碱基分子式的结构描述,这份基因测序工程文件的碱基对容量大幅飙升了上百倍,
所以,数据量达到了2G,或许相对于整个盒子里的DNA信息还相差太远,但是,进行一些浅显的研究,已经具备一定的参考价值。
第四章
这是硬盘!
程翔仔细盯着屏幕,屏幕上的碱基对,时不时标出一段带问号的替代符号,时不时又是一段红色缺失替代符,或疏或密,带问号的替代符是远在火星扫描时就已经无法确定的碱基对,而红色的缺失替代符,则是因为火星传输数据到地球数据发生了丢失,漫长的距离,光是信号抵达都需要好几分钟,要做到传输不丢数据,代价太大。
以现在的技术能力,也没办法做到高效的确认重发机制。有眼前这个时间戳表示有信号没收到已经非常的不错。
“不少错漏啊。”程翔感慨,不过也没办法,搞研究就是这样,哪有那么多理想的条件,“不过,还能有这么多信息,已经相当的不错了。”
“知足吧。”
毕竟,前期最重要的任务,就是初步确定这个盒子的价值,确切的说,是这盒子里基因的价值。
眼下的工程文件,左侧的活动面板上是一个树形结构,里面有十个子节点,表示着从1到10号盒子的基因测序矢量图文档,双击就可以打开对应的数据视图。这款工程软件,就是银河研究所制定的。
有程翔的把关,一众专业生物专业的专家教授不断给出意见,这款软件在使用上自然非常顺利可靠。
现在最重要的工作是确定这份基因的研究价值,而这种类似解谜般的工作向来都是难度最高的,那种感觉,跟只告诉你前面那座大山里有宝藏,但是不知道埋哪里,要你自己去找一样。
大海捞针莫过于此。
程翔没有立刻去查看基因的细节,想了想,“被发现的盒子,在内部一共有49个形状一致的小盒。”
“这也算是一个线索,既然如此。”
程翔想起了这款软件的一个功能,也是非常方便的功能,就是基因测序比对。
和常用的文档字符串比对一样,基因比对,则是将不同DNA测序文档进行比对,比对的则是碱基对的排列组合是否一致。不一致的,会逐个做下标记,比对完成后,按快捷键F3,可以快速依次查看每一个不同点。
“先比对下吧。”
“说不定就有了什么发现。”
探索过程最常见的就是试错,试错,自然也是从成本最低的开始,没有什么比这个更简单,想到这里,陈翔立刻将使用鼠标,选择全部文档,右键选择比对所有。进度条顿时展开,比对结果实时展示。
一份200MB的DNA图谱,足够存储16亿个碱基对信息。十份DNA测序图谱同时比对,这个运算量一般的电脑根本撑不住。不过,得益于软件需求是一群专业生物研究工作者提出,所以算法早就考虑到了生物科学的特殊性。比对按照增量的方式进行,即时开始,即时出具实时结果,又可以随时终止。
而且,更别提,实验室大楼内部早就配置一部超算,复杂计算可以委托超算进行处理。以超算每秒10的17次方每秒的运算速度,区区两百亿数据量的比对工作,根本不值得一提。
进度条几乎是眨眼即过,比对的结果应声而出。
程翔紧紧盯住屏幕,屏幕上,一份DNA碱基对比对视图已经绘制完成,十份视图全部重合的部分则打印白色,存在不同则会黄色标注,点击上去,还能看到各编号视图在该位置时基因的实际情况。
不过因为显示和内存的关系,显示器同一时间只能显示一个区间段的结果。
这个区间分段足足十几万个。
程翔直接翻看旁边的统计结果。
这一看,程翔立刻放下了嘴边的枸杞茶,神情变得格外凝重。
粗检验,重合率百分之四十五。
去除丢失片段,重合率百分之六十,
再去掉本身遗失的片段,重合率足足百分之九十九点九九九!
“重合率百分之九十九点九九九!”
程翔深深吸了口气,拿起旁边的内线电话,就拨通了候志洁的办公座机,电话响了两声就被接起。
“侯主任,你来一下,我想,我已经有了发现。”
电话那头的候志洁没有任何犹豫,她才刚刚把刚才收到的数据分发给各个小组,其他的都还没来得及做,程翔这边就已经有了突破,放在其他人身上她会怀疑对方的专业性,但是,放在程翔身上,对于程翔的快她早就习惯,二话不说挂断电话立刻赶了过来。