日前,北京大学黄岩谊教授带领的团队在《自然—生物技术》期刊上在线发表《基于信息理论来修正错误的高准确度荧光产生 DNA 测序方法》,这标志着我国学者已成功刷新 DNA 信息解读的精确程度,从根本上提高了测序方法本身的精度,打破了国外在基因测序领域的技术垄断,极大推动了我国生命科学与医学的研究发展,同时今后有望为婴儿基因突变检测、循环肿瘤 DNA 等测序临床医学应用的进一步发展提供更好的工具。
这个研究团队,包括北京大学教授谢晓亮、黄岩谊,博士后陈子天,博士研究生周文雄、乔朔、康力以及副研究员段海峰。7 位成员分别来自化学、物理、生物等不同学科背景。
发明了纠错编码测序法,大幅提升了基因序列测定的精度
众所周知,生命之所以能够代代相传、生生不息,奥秘在于承载遗传信息的 DNA。人的基因组含有多达 30 亿对碱基对,理论上有无穷的排列组合。而 DNA 的序列测定是进一步研究和改造目的基因的基础,在生物学、医学等领域意义重大。因此在科学家解读遗传密码时,测序技术是强有力的解码工具。
以前,中国的 DNA 测序技术在世界上处于第二梯队,前沿科技仍被美国公司和科研机构垄断。中国的数千家测序服务公司只能斥巨资引进国外测序仪,并不具备在技术源头的解决方案,更没有自己的测序仪。
“就像需要自己的飞机一样,中国也需要自己的测序仪。如果一味借用别人的技术,将永远没有机会领先。”正是出于这种想法,黄岩谊带领的课题组利用 7 年时间,发明了纠错编码(ECC)测序法,自此,我国基因测序技术拥有了独立自主的核心技术与知识产权。
如同古埃及罗塞塔石碑一样,碑上分别用古希腊文字、古埃及象形文字和当时的通俗体文字刻了同样的内容,近代的考古学家对照 3 种语言版本内容,解读出古埃及象形文字。ECC 测序方法同样利用 3 种不同方式检测同一序列,通过创建 3 个正交简并序列,将信息冗余和测序过程结合,发现和纠正测序中产生的错误,从而大幅提升基因测序精度。
以基础研究促进新技术发展,从根本上推动应用
“随着产业的不断发展壮大,竞争将越来越集中于‘上游’技术源头。此次 ECC 测序方法的发现,正是从源头把握住 DNA 测序方法,打破其他国家商业垄断的钳制,掌握核心知识产权。” 黄岩谊介绍。“这是非常重要的原创文章,不是那种快速论文。”谢晓亮表示,ECC 测序方法将把下一代测序仪的精度大幅提升。
从中国制造向中国智造迈进,现代农业通过筛选优良基因进行育种、现代医学通过 DNA 测序进行疾病监测与预防……DNA 测序研究成果不仅促进中国生命科学研究的发展,也能够为世界提供中国智慧。“虽然目前在一些领域我国依旧是跟跑阶段,但是相信我们有潜力在未来成为领跑者。” 黄岩谊说。
ECC 测序法研究成果属于基础前沿研究,是引领其他学科研究发展的原始创新与先导。“我们从基础科学出发推动新的技术发展,才能从根本上推动应用。如同只会造车,没有高度过硬的核心发动机驱动也不行。”黄岩谊介绍。
用 7 年的时间做一项研究,经历了科研难关、经费紧张、工作停顿、人员不稳定等诸多问题。“很多时候不能直接感觉到关键突破口在哪里,需要不断摸索。很多已有知识不能直接应用,需要融会贯通。”黄岩谊介绍。“论文发表当然很开心,但更重要的是科学研究自身的价值,和探索过程中的成就感。”这是课题组成员的共同感受。
论文没有秘密,希望与全球的科学家共享进步
科学研究的美在于真理往往以同一本质的不同面目贯穿于诸多学科之间。这也使得研究需要集合多方知识进行探索。
测序技术的开发就涉及化学、生物医学、计算机、微电子学、光学、材料科学和精密加工等多学科技术。
如果没有近年陆续成立的北京大学前沿交叉学科研究院和包括团队成员所在的生物动态光学成像中心等诸多跨学科研究中心,像 ECC 测序方法这样的需调动多方资源的复杂工程就很难组队。黄岩谊表示,“将不同研究领域、研究背景的老师和学生聚集在一起,共同推动科研发展,这才使得此次研究能够融合多方智慧,最终获得成功。”
承担了关键的数学推导、算法优化以及编程实现的团队主要成员、北京大学生命科学学院生物物理学专业博士生周文雄表示,关键算法的诞生是来自一次偶然的课堂实践。“美国国家科学院院士迈克尔·沃特曼教授的研究理论在 70 年代的生物信息学研究领域影响深远,我幸运地在一次课堂活动中获得了与他访谈的机会。一天晚上做完实验回家的路上,我突然发现这一理论为课题提供了算法计算的灵感。”
当然,一切大胆猜想都需要细致严谨的印证。在黄岩谊看来,“研究成果体现了基础工作抽象原理的突破和工匠精神的完美结合。不仅要想得好,而且要做得好。用更好的技术,做更好的科学。”
研究过程中,搭建宽松的科研平台,提供优质资源,学生得以不断成长进步,这一点使黄岩谊备感欣慰,“我国基础研究发展的关键还是要培养创新人才,因为我们不仅要掌握造仪器的技术,还要培养一批能够发明新仪器的年轻的尖端科学家。”
“我从做物理化学实验,一直到做分子生物学、光学实验,从研究仪器、流体控制,最后到研究计算机算法。回想起来,真是什么都学到了。”论文的第一作者、研究的主要推动者陈子天博士表示,他最初加入课题组时还是北大化学系本科生,做着做着读完了工学院博士,现在是生命科学学院的博士后。
ECC 测序研究工作从启动到发表,历时 7 年,其中经历种种挑战与考验,但做出精品的过程是美的。“最初也没想到会有这么艰难,但是慢慢就发现有趣的地方在哪儿了。这篇论文没有秘密,希望我们所有的理解、发现、进步,都能与全世界的科学家共享。”黄岩谊说。