DP性能是上一代的12倍NVIDIAVolta体系结构分析

NVIDIAVolta架构是几年前就已经明确的新一代架构,在上周的GTC2017大会上正式与大家见面。老黄如去年所述,NVIDIA将来可以大幅提高产品的重复速度,推动GPU界的发展,Volta架构的发布距离Pascal架构的发布正好经过了一年。在这短短的一年时间里,老黄帕斯卡家族全部筛选掉,以大家熟悉的GeForce系列游戏卡为例,从GT1030到GTX1080Ti,高中低级的东西应有尽有,比Maxwell2家族的集体出道早了大约一年。为什么NVIDIA仅仅一年就可以发布新的架构产品?与AMD延迟相比,NVIDIA严格按照自己公司的产品路线图发布产品,因此受到HBM图形内存产能的限制,NVIDIA在Maxwell和Volta之间添加了Pascal作为过渡,但Pascal的表现并没有掩饰,可以说是GPU史上的里程碑。NVIDIA的Pascal显卡使GPU的频率首次突破2GHz大关,在超频主控手上可以超过3GHz,所以以前完全没有想过要赶上CPU的主频。采用Volta架构的第一款产品是NVIDIAXavierSOC目前GPU讲究的是能耗比,它不再像以前那样单纯追求绝对性能,而是采用TSMC全新的12nm Volta来展现能耗比的新高度:第一款产品Teslav100与P100相比在TDP相同的300W的情况下,单精度浮点运算性能提高41.5%,实际的HPC应用性能提高40-70%,通过架构中新引进的Tensor单元,深度学习的性能可以达到后者的12倍!NVIDIATeslaV100我们上周在第一时间报道了有关TeslaV100的新闻,我们可以看到815平方毫米的核心面积、210亿晶体管、5120个CUDA核心、15TFLOPS单精度性能等专业数据,但Volta与Pascal相比有哪些设计方面的提升和变化我想大家都很感兴趣。接着吉吉,“老黄”的ldquo,新的核弹rdquo;到底是什么样的构造呢。外观:PCI-E版机身迷你与采用Pascal架构的Teslap100相同,Voltap100也有两种版本,一种是DGX-1使用的NVLink版,另一种是标准的PCI-E版,两种版本的规格相同。首先,我们来看一下NVLink版的V100和P100的比较。上图为Teslav100,下图为Teslap100。V100和P100的TDP都是300W,因为使用了16GB的HBM2图形内存,NVLink版的PCB设计几乎相同,只是在面料型号和布料上有点不同。还应强调,V100使用新的NVLink2接口,比NVLink多两组信道,双向总带宽达到300GB/s,比NVLink提高87.5%。下面我们来看一下PCI-E版的对比:上图为TeslaV100,下图为TeslaP100 PCI-E版TeslaV100与P100相比,体积大大缩小,不仅从两个槽的厚度变成了一个槽,PCB也从标准长度缩小到手掌大小,不比NVLink版的大小大多少。真的不知道老黄是怎么这么用ldquo的。通过寒酸的被动散热将TDP压制到300W的ldquo,性能巨兽rdquo;只能期待NVIDIA的后续详细介绍。劝诱

返回列表
上一篇:
下一篇:

文章评论