GTX 1070 Ti 显卡紧急登场后,NVIDIA 16nm Pascal 帕斯卡家族已经彻底完成历史使命,接下来的一代将是 12nm Volta 伏特。虽然游戏卡还要等到明年春,但在高性能计算领域,新架构新核心的 Tesla V100 早已经登场,并逐渐打开局面。
在此之前,Google 部署了帕斯卡架构的计算卡 Tesla P100,而现在,亚马逊则拥抱了新的 Tesla V100,用于自家 AWS 云服务。
Tesla V100 拥有 5120 个 CUDA 核心、640 个 Tensor 辅助核心,面积达 815 平方毫米,集成了 210 亿个晶体管,浮点性能半精度 30TFlops、单精度 15TFlops、双精度 7.5TFlops,Tensor 深度学习性能则有 120TFlops,搭配 16GB HBM2 高带宽显存。
相比之下, Tesla P100 内置 3584 个流处理器,单精度浮点性能刚刚接近 10TFlops,而且没有专长神经网络训练、推理的 Tensor 核心。
亚马逊采用了三种不同的方式部署 Tesla V100,分别为单路、四路、八路(后两者采用 NVLink 总线互连),各搭配 64GB、256GB、512GB 系统内存。