如今,显卡不仅在工作站、个人PC中变得非常重要,而且在数据中心也处于举足轻重的地位。CPU负责通用计算、GPU负责加速计算已经成为绝大数数据中心一种常态。用于加速计算的GPU专用处理器,它将计算密集型任务从CPU中分离出来,CPU继续发挥自己通用计算和逻辑运算能力,将并行计算、机器学习和AI计算等任务交给GPU处理。

实际上,从1999年GPU被定义开始至今,GPU通用加速计算已经非常成熟。它包含一系列加速技术栈,软件时加速计算中至关重要的一部分,其中包括加速库、算法、系统软件以及服务器芯片厂商与开发者一同研发的优化方案。

两个根本动力将加速计算推向一个新高度。第一,新型算法的出现,称之为数据驱动或机器学习算法,数据处理和数据中心内的数据传输变得比以往更加重要。

第二,单独一台机器无法满足庞大处理需求的各种应用。单独一台机器无法满足庞大处理需求的各种应用。不管一台服务器有多么强大,它也不能满足现在的应用负载需求了。实际上,服务器已经不再是计算单元了,而数据中心是新的计算单元。

在未来十年,数据中心量级的计算将成为常态,而数据中心将会成为最根本的计算单元。这也不难理解,显卡巨头NVDIA为何并购了Mellanox。论网络、存储和安全,没有公司比得上 Mellanox 。

而在最近的GTC上,老黄就展示了与Mellanox合作研发的Mellanox Spectrum 4000系列交换机,用于搭建机器学习、AI计算开发等通用计算的开发者平台。

老黄宣称,这是目前最顶尖的以太网交换机。每一个端口最高支持400Gbps带宽,整个交换机的带宽达到惊人的25.4Tbps。还宣称这款交换机除了具有高性能和Mellanox 全球知名的低延时,还有其他三个特性。

1、数据缓冲架构,可以测量交换机的整体带宽,进而可以给每个端口分配一个均衡且可以预测的带宽。

2、无与伦比的虚拟化技术,实现跨超大规模数据中心和VXLAN路由虚拟化。

3、可以准确掌握最新状况,通过这个全新的WJH技术—What Just Happend。服务器交换机的另一端是可编程智能NIC—NVIDA Mellanox Bluefield 2,世界上最先进的可编程智能NIC。

Bluefield 2以线速度加速安全和数据包处理最高可达200Gbps。网络、储存和安全堆栈现在被完全分离,运行都在这些可编程智能NIC上,它将成为一个重要的基本数据处理单元,成为未来计算发展的三大支持之一。CPU负责通用计算、GPU负责加速计算,DPU负责数据中心的数据传输和处理。

NVIDIA SDK

老黄还说NVIDIA今年一共推出了50套新的SDK—NVIDIA SDK形成的技术栈。基本上分为三层,

第一部分当然是CUDA架构,NVIDIA的所有产品都与这个架构兼容。该层当然是最新的CUDA11,它能够在架构上做到向前和向后兼容。基于CUDA的开发人员,知道自己开发的应用可以在所有NVIDIA的GPU上完美运行。

第二层是CUDA X,包含NVIDIA的加速计算库、线性几何库,信号处理库,图分析库。今年,我们也推出了几个新的库。cuDNN8、TensorRT 7.1,深度学习网络编译和优化器。

而在这之上,也就是第三层,还有面向专业市场及领域的库。RTX库用于光线追踪、HPC用于高性能计算,RAPIDS用于数据分析,AI用于人工智能,Clara用于医疗健康和生命科学。Metropolis,视频分析及流媒体人工智能平台,DRIVE用于自动驾驶,Lssac用于机器人,Aerial 5G最新的5G虚拟RAN处理库。

相关文章