岁末年初
回首这不寻常的2020年
NVIDIA又给人类带来了不少新的技术
今天和大家一起再次回顾一下
“NVIDIA 2020 GPU技术盘点”
快来Pick你心中的年度最佳吧!
DGX大家族在2020年迎来了家庭新成员,分别是320GB和640GB的DGX A100以及DGX Station A100。它们强大的性能小丽不再赘述:
DGX SuperPOD解决方案是NVIDIA发布的全球首个企业级一站式AI基础设施。它是由包含20个到140个独立的NVIDIA DGX A100系统构建的集群,借助NVIDIA Mellanox HDR InfiniBand网络互联的20个模块,AI性能最低可达到100petaflops,最高可达700petaflops,可运行最复杂的AI工作。
第三代A100 Tensor Core
它为人工智能带来了惊人的加速,将训练时间从几周缩短到几小时,并为推理提供了巨大的加速。NVIDIA安培体系结构提供了巨大的性能提升,并提供了新的精度,以覆盖研究人员所需的全谱-TF32、FP64、FP16、INT8和INT4加速和简化人工智能采用,并将NVIDIATensor Cores的功率扩展到高性能计算机。
Tensor Float 32
随着人工智能网络和数据集继续呈指数级增长,它们的计算需求也同样增长。较低精度的数学运算带来了巨大的性能加速,但它们历来需要一些代码更改。A100带来了一种新的精度,TF32,它的工作原理和FP32一样,同时为人工智能提供高达20倍的加速,而不需要任何代码更改。
NVIDIA于2019年3月推出了4GB版本的Jetson Nano,随后11月初,又发布了内存为2GB的Jestson Nano开发套件。这两款产品都具备超高的性能和能效,可以运行现代AI工作负载,并行运行多个神经网络,以及同时处理来自多个高清传感器的数据。它专为支持入门级边缘AI应用程序的设备而设计,完善的NVIDIA JetPack SDK包含用于深度学习、计算机视觉、图形、多媒体等方面的加速库。
DPU处理器
这是NVIDIA在AI计算领域的全新产品,未来三年计算吞吐量将提升1000倍,将为数据中心带来突破性的变革。不同于GPU、NPU等在数据中心扮演加速卡的角色,DPU处理器是专为数据中心设计的,此次NVIDIA推出了BlueField-2 DPU,同时还有全新的DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)软件生态架构。
BlueField 2 DPU是一个具有Arm核心和加速引擎的可编程处理器,用于网络、存储和安全的在线处理,DOCA是一种数据中心基础设施芯片架构,支持突破性的网络、存储和安全性能,为数据处理器提供支持。
BlueField-2集成了8个64位A72 Arm核,2个超长指令字(VLIW)加速引擎,以及两个100Gb/s的网络通道(Mellanox ConnectX 6 Dx NIC),并加速关键的数据中心安全性、网络和存储任务,其中包括隔离、信任根、密钥管理、RDMA/RoCE、GPU Direct、弹性块存储、数据压缩等。
NVIDIA创始人兼CEO还透露了未来三年NVIDIA DPU的发展路线图,其中包括NVIDIA BlueField-2系列DPU和NVIDIA DOCA软件开发工具包,用于构建DPU加速数据中心基础设施服务的应用程序。预计到2023年,BlueField-4问世的时候,整体效能最高可提升1000倍。
EGX平台
EGX平台的核心是一个可在NVIDIA NGC上使用的优化AI软件堆栈,该软件目录提供了一系列行业特定的AI工具包和预培训的模型,降低了在NVIDIA认证系统上构建和部署AI应用程序的难度。
视觉AI、5G、CloudRAN、安全和互联网企业与业内主要服务器制造商利用NVIDIA EGX平台帮助企业将AI推向边缘。此外,EGX平台正将NVIDIA Ampere GPU和BlueField-2 DPU功能整合在一张PCIe卡上,NVIDIA还宣布推出NVIDIA Fleet Command混合云平台,该平台具备边缘计算的安全性、实时处理能力、远程管理和SaaS的简便。
在GTC 2020秋季站上,NVIDIA发布了Quadro RTX A6000和A40两款专业视觉用途的产品。
RTX A6000 GPU基于全新NVIDIA Ampere架构,让创意人士能够完成复杂的创作任务,例如实时8K HDR视频编辑和超大型3D模型动画制作等。该GPU的内存为48GB,是单个GPU可提供的最大内存,通过NVLink连接两个GPU可以扩展到96GB。
第二代RT Core为光线追踪运动模糊渲染增加了硬件加速,性能比上一代提高了7倍。
RTX A6000采用PCIe Gen 4.0,使GPU与电脑其余部分之间的连接速度增加了一倍,特别适合用于处理超高分辨率和HDR视频。
NVIDIA A40提供基于数据中心的解决方案,可满足设计师、工程师、艺术家和科学家所需,助其攻克当今面临的挑战。A40依托于NVIDIA Ampere架构而构建,将新一代RT Core、Tensor Core、CUDA Core与48GB显存融于一身,可提供远超以往的图形处理、渲染、计算和AI性能。
从随时随地可供访问的强大虚拟工作站,到专用渲染节点,A40旨在处理数据中心中要求非常严苛的视觉计算工作负载。
NVIDIA CloudXR
随着5G的建设,AR和VR应用的需求也被激发。NVIDIA CloudXR通过5G网络为专业工作流提供速度更快的增强现实和虚拟现实。NVIDIA与AWS合作通过云端实现无线AR和VR流式传输。
借助NVIDIA CloudXR,用户无需与高性能计算机实体相连就能驱动丰富的沉浸式环境。SDK在云端或本地的NVIDIA服务器上运行,可提供无线虚拟、增强或混合现实环境(统称为XR)所需的高级图形性能。
不论是审核3D模型的产品设计师,还是在模拟救援场景进行实践的急救人员,任何人只需借助手持平板电脑、VR头显和AR眼镜等Windows和安卓设备,都能够尽享CloudXR的优势。
Omniverse专业视觉以及协同设计
如今AI无处不在,在专业视觉领域,NVIDIA拥有Quadro RTX GPU和虚拟GPU解决方案等领先产品。
在硬件新品发布的同时,NVIDIA宣布NVIDIA Omniverse平台已进入公测阶段。Omniverse整合了NVIDIA在图形、仿真和AI领域的突破,是全球首个基于NVIDIA RTX的3D仿真模拟和协作平台。
数千万设计师、建筑师和其他领域的创作者将能通过该平台实现本地或远程实时协作,例如负责3D建筑设计迭代的建筑师、修改3D场景的动画师以及协作开发自动驾驶汽车的工程师,整个协作就像是在线上共同编辑文档一样简单。