12 月 25 日,腾讯云近日正式推出国内首个基于自研 FPGA 极光技术的 NGS 加速方案,极大提升人类全基因组分析效率,有效改善基因领域数据分析速度慢、效率低等问题。
面对基因数据量的传输难题,腾讯云建成国内最全的 28 线 BGP 网络环境,使基因客户快速稳定地上传和下载数据,同时还能帮助基因企业客户做数据上云,通过一键分发的功能让基因企业将数据传递给科研用户。
其次,腾讯云通过提供文件存储、对象存储和归档存储等存储服务,满足基因领域客户面对不同的数据使用场景和需求,而针对最核心的计算环节,腾讯云提供超算云服务,使科研工作者和基因企业能够选择多种高性能的虚拟机和物理机来加速基因计算。
除此之外,腾讯云为基因行业专门开发了一体化的数据管理平台“腾讯云双螺旋 PAAS 平台”,满足基因用户传、存、算、管等需求。据了解,腾讯云双螺旋平台具有三大特点。首先是快速分析,通过在双螺旋上使用 FPGA 来加速基因分析过程,对二代测序,已经可以节省 90% 的时间,后续会继续推出三代加速的服务。其次是节省费用,依托双螺旋的精准调度能力,双螺旋会在计算过程中按需调度最匹配的算力执行任务,避免出现 CPU 或内存大量空跑情况。第三是人工智能技术的赋能,已在精准医疗领域落地。例如,在广东,AI 腾讯觅影在帮助医生做早期食道癌的筛查,对一张内镜检查影响,觅影 AI 可以在 4 秒内做出诊断,准确率达到 90%。
腾讯双螺旋 PAAS 平台特点示意图
NGS 加速方案,提升人类全基因组分析效率与分析准确率
腾讯云基因团队近日推出的基于自研 FPGA 极光异构系统的 NGS 加速方案,可将人类全基因组分析从 30 小时优化到 2.8 小时。在实验过程中,研究人员采用一份 30 倍测序深度的人类全基因组 FASTQ 文件(NA12878),分别在业界常用的通用高性能服务器与搭载 FPGA 极光异构系统的服务器上进行了对比测试,实验数据表明,腾讯 NGS 加速方案加速比超过 10 倍。
传统计算系统与腾讯极光异构系统对比
据了解,传统的计算系统通过采用多个高端 CPU 搭建 HPC 系统实现了缩短时间的目的,但这样也使得成本增加,基因企业规模受限。而腾讯极光异构系统在提供卓越性能的同时,还能进一步降低基因客户的成本。它采用自研核心技术极光(Aurora Technology),通过以下三个方面整体优化传统的分析和计算流程。
第一,搭载 BWA_MEM 和 Variant Calling 专用硬件算法核。采用业界顶尖的大规模集成电路设计技术,把算法性能提升了一个台阶。
第二,算法级优化内存访问的方式。
第三,IO 瓶颈导致系统性能无法提升一直是基因二代分析流程的一大痛点,通过系统和算法级别优化以及异构加速大幅降低 IO 带宽需求。
腾讯极光技术原理解析
在极大提升分析效率的同时,极光技术还保证了优异的分析准确率,与传统软件分析准确率基本一致。研究人员将通用服务器和极光异构系统上计算得出的分析结果,上传 PrecisionFD 网站进行比对。比对结果如下图 2 和图 3 所示:
通用处理器测试结果
极光异构系统测试结果