NVIDIA® Tesla® P100

  • CUDA核心: 3584
  • 显存: 16 GB HBM2
  • 半精度: 18.7 TFLOPS
  • 单精度: 9.3 TFLOPS
  • 双精度: 4.7 TFLOPS

将人工智能应用于自动驾驶汽车,预测未来气候,研发治疗癌症的新型药物,这些都是如今需要克服的全球重大挑战,但是,必须进行海量的计算才能实现相应目标。当今的数据中心依赖大量互连的通用计算节点,在性能方面难以驱动重要的高性能计算 (HPC) 和超大规模工作负载。


NVIDIA® Tesla® P100 GPU 加速器为现代数据中心释放强大的计算能力。它利用全新的 NVIDIA Pascal™ 架构打造出速度极快的计算节点,性能高于数百个速度较慢的通用计算节点。利用更少的快速的节点获得更高的性能,能在节省资金的同时,大幅提高数据中心吞吐量。

超过 550 个 HPC 应用程序(包括 10 大 HPC 应用程序中的 9 个)以及深度学习框架已得到加速,现在每个 HPC 客户都可以在他们的数据中心中部署加速器。

 搭载 NVLINK 技术的 TESLA P100 加速器可使数据中心应用程序性能提升高达 50 倍


NVIDIA® Tesla® P100规格

GPU 架构

NVIDIA Pascal™ 

NVIDIA® CUDA® 核心数量

3584

双精度性能

4.7 TFLOPS

单精度性能

9.3 TFLOPS

半精度性能

18.7 TFLOPS

GPU 内存

16 GB HBM2

内存带宽

732 GB/秒

功耗

250W

ECC

原生支持,无容量或性能占用

散热方案

被动式

规格

PCIe 全高全长

计算 API

NVIDIA® CUDA®、DirectCompute、OpenCL™、OpenACC


NVIDIA® Tesla® P100  进行了全方位重新塑造,从原材料硅到成品,各个层面都采用创新方法精工制作。每一项开创性的技术都使得性能大幅提升,从而打造出更为快速的计算节点。

NVIDIA Pascal™ 架构为性能带来巨大飞跃
全新的 NVIDIA Pascal™ 架构让 NVIDIA® Tesla® P100  能够为 HPC 和超大规模工作负载提供超高的性能。凭借每秒超过 20 万亿次的 FP16 浮点运算性能,经过优化的 Pascal 为深度学习应用程序带来了令人兴奋的新可能。
通过采用 HBM2 的 CoWoS 技术实现更高效率
通过加入采用 HBM2 的 CoWoS(晶圆基底芯片)技术,NVIDIA® Tesla® P100  将计算和数据紧密集成在同一个程序包内,其内存性能是上一代解决方案的 3 倍以上。这让数据密集型应用程序的问题解决时间实现了跨时代的飞跃。
使用 NVIDIA NVLink™ 的大规模应用程序
计算性能常常受到互联的限制。革新性的 NVIDIA NVLink™ 高速互联专为扩展跨多个 GPU 的应用程序而设计,与目前一流的技术相比,其性能提高了 5 倍。
注意:适用于 PCIe 的 NVIDIA® Tesla® P100  无法使用此技术
页面迁移引擎让编程更简单
页面迁移引擎解放了开发者,让他们能够更专注于优化计算性能,在管理数据移动方面少花些精力。目前,应用程序可能超过 GPU 的物理内存大小,其内存能达到两兆兆字节。


电话咨询
在线地图