logo
视觉计算推动者 010-86460505

成功案例 > 正文

NVIDIA® DGX-1™ 助力北京大学物理学院加速蛋白质冷冻电子显微镜图像数据的二维分类与三维重构

案例简介

•  在本案例中,我们利用NVIDIA® DGX-1深度学习超级计算机(含八块NVIDIA® Tesla® V100)运行relion程序处理了蛋白质的冷冻电子显微镜图像数据,加速了图像的二维分类与三维重构过程。

•  本案例主要应用到NVIDIA® DGX-1深度学习超级计算机。

Case Introduction

•  In this case, We run the program relion to process the cryo-electron microscopy data of protein with NVIDIA® DGX-1 supercomputer, which has 8 NVIDIA® Tesla® V100 GPUs. DGX-1 speeds up the 2D classification and 3D reconstruction of image data to a large extent.

•  The major product utilized in the case is NVIDIA® DGX-1 deep learning supercomputer.

背景

冷冻电子显微技术是目前解析蛋白质等生物大分子微观结构的利器。2017年10月,Jacques Dubochet、Joachim Frank和Richard Henderson凭借他们在发展冷冻电子显微镜(cryo-electron microscopy, cryo-EM)方法学用于解析生物大分子高分辨结构方面的杰出贡献,获得了当年的诺贝尔化学奖。

本研究组主要从事冷冻电镜技术的方法研究,并利用新方法解析蛋白结构揭示其生理机制,研究成果先后发表于science、Nature Communication、PNAS等国际知名期刊。例如,2018年4月10日《Nature Communication》发表了本研究组关于冷冻电镜技术解析人源蛋白酶体26S全酶的3个亚稳简并态高分辨结构的研究成果(Y. Zhu, W.L. Wang, D. Yu, Q. Ouyang, Y. Lu, Y. Mao. Nucleotide-driven triple-state remodeling of the AAA-ATPase channel in the activated human 26S proteasome. Nature Commun. 9, 1360 (2018))。蛋白酶体是细胞中用来调控特定蛋白质的浓度和清除错误折叠蛋白质的主要机制的核心组成部分,是细胞中最普遍的不可或缺的大型全酶超分子复合机器之一,也是迄今为止发现的最大的蛋白降解机器。本研究组利用自主开发的基于统计流行算法的高性能计算软件ROME(J. Wu, Y. Ma, C. Congdon, B. Brett, S. Chen, Q. Ouyang, Y. Mao. Massively parallel unsupervised single-particle cryo-EM data clustering via statistical manifold learning. PLoS ONE 12, e0182130 (2017))与优化的冷冻电镜处理方法,对ATP-γS结合状态下的人源蛋白酶体的全酶冷冻电镜单颗粒数据展开了深入分析,得到了6个共存的动态结构,其中包括3.6埃分辨率的基态结构、3.5埃的开放态CP结构和3个CP开放态对应的亚稳简并态全酶4.2埃、4.3埃和4.9埃的结构。另外两个中间态结构分辨率为7.0埃和5.8埃。该研究首次观察到位于AAA-ATPase激酶马达模块中心的底物转运通道呈现从螺旋到鞍形不同的拓扑结构变化,为进一步分析底物和蛋白酶体全酶的相互作用奠定了重要基础。

目前,本研究组基于之前的成果,继续研究蛋白质三维结构解析新算法的开发,并尝试运用这些算法进一步揭示蛋白质的生理学奥秘。

挑战

冷冻电子显微镜技术的数据处理过程中计算量极大,因而对数据处理所用的计算机软硬件质量提出了较高的要求。在冷冻电子显微镜数据处理的整套流程中,耗费计算量最大的步骤是其中的蛋白质二维图像的分类过程与三维结构的重构过程,在这些处理过程中,由于蛋白质图像的数量大、像素高,以及计算过程需要对图像做平移、旋转、计算相似度等操作,因而对计算机的计算单元与存储单元均有极高的要求,利用传统的cpu运算速度较慢,效率较低,常常需要几十个cpu节点数百个核心才能满足计算要求。针对这一问题,cryoSPARC软件在《Nature Methods》上发文报道运用随机梯度下降法和分支界限法简化冷冻电镜数据处理算法,减小电镜数据处理所需的计算量,大大提高了电镜图像的数据处理速度。

方案

为进一步解决冷冻电镜数据处理的计算问题,最为常用的relion软件在其中的部分处理模块中运用GPU加速,利用GPU强大的并行处理能力解决传统cpu计算效率低下的弱点。在冷冻电镜数据处理中耗费计算资源最大的二维图像分类和三维结构重建的计算过程中,NVIDIA® DGX-1中的V100 GPU发挥了重要作用,计算速度和效率与传统的cpu相比有了很大幅度的提高,与数十个传统cpu节点的计算效果可相媲美,因而在不简化算法的基础上,使冷冻电镜图像数据的快速处理成为可能。

影响

NVIDIA® DGX-1深度学习超级计算机在加速冷冻电子显微镜的图像数据处理中起到了非常重要的作用,其结果令人满意。一块GPU的运算速度可以与传统几十个甚至上百个cpu核心相比拟,计算效率取得了极大的提高,因而在冷冻电镜数据的分类与重构处理中,GPU计算可能代替cpu,成为未来的主要发展方向。