亮点十足!全新NVIDIA A40现身?

2020-11-16 15:44:06 406

现代数据中心正在迅速发展。实时光线追踪、AI、计算、仿真和 VR 等先进技术在各行各业中已屡见不鲜。对于远程工作的迫切需求超出了所有人的预期,且这样的工作负载已遍及整个企业。

NVIDIA A40

NVIDIA® A40 提供基于数据中心的解决方案,可满足设计师、工程师、艺术家和科学家所需,助其攻克当今面临的挑战。A40 依托于 NVIDIA Ampere 架构而构建,将新一代 RT Core、Tensor Core、CUDA® Core 与 48GB 显存融于一身,可提供远超以往的图形处理、渲染、计算和 AI 性能。

从随时随地可供访问的强大虚拟工作站,到专用渲染节点,A40 旨在处理数据中心中要求非常严苛的视觉计算工作负载。

一睹为快:A40的工作负载

 虚拟工作站 

同时搭载并采用具有 48GB GPU 显存的 A40 与 NVIDIA vGPU 软件,可提升从数据中心远程访问的全球功能超强大的虚拟工作站的速度。

与前一代相比,NVIDIA Ampere 架构的 CUDA Core 和第三代 Tensor Core 可在 NVIDIA 虚拟计算服务器 (vCS) 软件的助力下,提升面向计算密集型工作负载(如数据科学、深度学习和机器学习)的性能。

 渲染 

第二代 RT Core 可将吞吐量提至前一代的两倍,并支持同时开展光线追踪和着色,从而可提高光线追踪性能。

A40 具有 48GB 的 GPU 显存,并支持通过 NVLink 技术扩展至 96GB,可提供大型 GPU 加速渲染所需的显存容量。

 可扩展的可视化体验  

启用显示端口后,用户可在显示模式下利用 Quadro Sync 和 NVIDIA Mosaic 等 NVIDIA Quadro 显示技术,达到绝佳的多显示器视频同步和可视化,从而创建出高分辨率显示环境,如洞穴式自动虚拟环境 (CAVE)、大型显示墙或场地型娱乐体验,从而能够借助 NVIDIA A40 实现沉浸式视觉体验。

 协作 (Omniverse) 

AEC 设计团队可以利用 NVIDIA A40 和 NVIDIA Quadro 虚拟数据中心工作站 (Quadro vDWS) 软件,在 NVIDIA Omniverse™ AEC Experience 中与远程同事和客户就大型 3D 模型展开实时协作。建筑师和设计师可以快速构思和迭代建筑设计想法,并通过实时光线追踪或沉浸式虚拟现实查看准确、可预测的可视化效果。

 边缘 AR/VR 

研究人员、开发者和科学家可借助 NVIDIA A40 GPU,将服务器配置为提供多个高性能工作站,以用于边缘的增强现实 (AR) 和虚拟现实 (VR) 开发。

NVIDIA 软件堆栈包含可供配置多个高性能虚拟工作站的 Quadro 虚拟数据中心工作站 (Quadro vDWS) 软件、用于开发 AR 和 VR 的各种 NVIDIA 开发者工具,以及带来无线 AR/VR 体验的 NVIDIA CloudXR™ SDK 使用。

 CAE/模拟 

计算机辅助工程 (CAE) 分析师和工程师可以通过 Quadro vDWS 软件更快地设置、测试和迭代模拟,该软件可以为虚拟工作站提供其所需的强大计算能力,支持其在所选的任何地点进行设计(白天)和计算(夜间)。

 直播 

通过结合使用 AI、实时光线追踪和虚拟化等先进技术,A40 为现场直播制作带来了业界领先的性能。

AI 增强型工作流程可帮助主播在使用一切设备开辟全球市场的同时,掌握更多新鲜创意并深入了解客户见解。

由 GPU 提供技术支持的实时光线追踪可带来逼真的虚拟场景和电影级动画。

NVIDIA A40


全新解读:A40全新亮点

 CUDA Core 

NVIDIA Ampere 架构的 CUDA Core 能将单精度浮点 (FP32) 吞吐量最高提升至前一代的两倍,可显著提高图形处理工作流程(如 3D 模型开发)的性能以及处理计算机辅助工程 (CAE) 桌面模拟等工作负载所需的计算性能。

 第二代RT Core 

单个 NVIDIA A40 主板能够凭借对阴影、反射和折射物理属性的准确把握,渲染复杂的专业模型,从而为用户提供即时见解。基于 NVIDIA A40 的服务器可与 NVIDIA OptiX、Microsoft DXR 和 Vulkan 光线追踪等利用 API 的应用配合使用,助力真正的交互式设计工作流程,继而提供即时反馈,以实现前所未有的超高生产效率。NVIDIA A40 的可将光线追踪的运行速度提升至前一代的两倍

 第三代Tensor Core 

与前一代相比,第三代 Tensor Core 可借助全新的 Tensor Float 32 (TF32) 精度,提供高达五倍的训练吞吐量,还可运用结构化稀疏技术,提供高达十倍的推理吞吐量,且无需更改任何代码。这缩短了 AI 模型训练或数据科学数据准备和建模工作流程所需的时间。支持结构化稀疏技术的硬件会通过压缩网络模型的大小并加快模型执行,进一步提升速度。新一代 Tensor Core 还支持脑浮点格式 (BFloat16)。

 编码或解码引擎 

A40 具有一个视频编码引擎和两个解码引擎,能够提供对 AV1 解码的支持,同时具有多流视频应用所需的性能,可用于提供安全与视频服务。

 PCIe 4.0 

A40 支持 PCI Express 4.0 (PCIe 4.0),可将 PCIe 3.0 x16 连接的带宽从 15.75 Gb/s 提高到 31.5 Gb/s,从而提高了数据密集型任务(如 AI 和数据科学)中 CPU 内存的数据传输速度,同时可从大型数据集中创建 3D 模型。更快的 PCIe 性能还加速了 GPU 直接显存访问 (DMA) 传输,从而能让支持视频的设备通过 GPUDirect® 更快速地传输视频数据,并利用 GPUDirect Storage 加快输入/输出 (I/O) 速度。

 节能高效的双插槽设计 

NVIDIA A40 的能效是前一代的两倍,且可兼容全球 OEM 供应商生产的各式服务器。

 48GB 的高速 GDDR6  显存 

A40 拥有 48GB 的 GDDR6 显存。用户可借助第三代 NVLink 技术连接两块 A40 显卡,获得高达 96GB 的组合显存,以满足渲染、数据科学、工程仿真和其他 GPU 内存密集型工作负载所需的内存需求。

 虚拟化就绪 

A40 与 NVIDIA 虚拟 GPU (vGPU) 软件相结合,助力远程用户打造规模更大、功能更强的虚拟化工作站实例,可用于高端设计、AI 和计算工作负载的较大工作流程。NVIDIA vGPU 支持访问虚拟工作站,并可助力用户实现可随处施行的灵活解决方案。

 AR/VR 

支持最新的高分辨率头戴式显示 (HMD)设备、高性能图形和 48GB 的较大 GPU 显存,能够创建出令人惊叹的沉浸式增强现实 (AR) 和虚拟现实 (VR) 体验,可在训练、产品验证、搭建场景和引人入胜的娱乐活动中加以应用。

 动态 BVH(层次包围盒)

硬件加速的动态模糊渲染(一种难以渲染的常见电影效果),意味着艺术家不再需要依靠动态矢量这种传统方法来实现动态模糊。尽管艺术家可以借助动态矢量灵活地调整后期的动态模糊,但却需要对反射和半透明进行视觉修复。

 NVIDIA 深度学习超级采样 (DLSS) 

由 AI支持的实时图像超分辨率可提高设计和可视化应用的交互能力和帧速率。用户可借助 DLSS 以较低的分辨率进行实时引擎渲染,并能在始终保持画质清晰的情况下,采用 AI 技术,输出分辨率较高的内容。

其他性能特点

 第三代 NVIDIA® NVLink——多GPU技术 

通过 NVLink 连接两块 NVIDIA A40 显卡,即可以高达 112.5 GB/s(总带宽)的速度在 GPU 之间传输数据,从而将有效显存占用提升一倍并实现应用性能的扩展。

 显存纠错码 (ECC) 

能够凭借无损计算精度与可靠性,满足对任务关键型应用的严苛数据完整性要求。

 第五代 NVDEC 引擎 

NVDEC 非常适用于实时解码的转码和视频播放应用。支持用户使用以下视频编解码器进行硬件加速解码:MPEG-2、VC-1、H.264 (AVCHD)、H.265 (HEVC)、VP8、VP9 和 AV1。将此项技术与 Ampere Tensor Core 结合使用后,A40 可快速地将 AI 和推理应用到实时视频之中。

 第七代 NVENC 引擎 

NVENC 可处理要求十分严苛的 4K 或 8K 视频编码任务,从而释放图形引擎和 CPU 来执行其他操作。NVENC 还支持虚拟工作站以流式方式传输 8K 内容,以处理高保真设计和渲染工作负载。此外,与基于软件的 x264 编码器相比,NVIDIA A40 的编码质量更胜一筹。

 先占 

指令级先占可实现对计算和图形任务的更精细控制,以防长时间运行的应用独占系统资源或超时。

供货

NVIDIA A40将自明年年初开始供应。敬请期待!

同时自明年年初开始,英伟达将提供对NVIDIA虚拟工作站等NVIDIA虚拟GPU软件的支持。

电话咨询
最新产品
官方商城
QQ客服