3U一体(CPU,GPU,DPU)三种芯片,英伟达开创一个新纪元

2021-04-27 11:36:42 福瑞鑫智能科技
相比已成就的GPU时代,英伟达又在亲手打开新时代。
3U一体(CPU,GPU,DPU)三种芯片,英伟达开创一个新纪元

就在刚刚结束的 GTC2021 大会上,号称 “AI教父” 的黄仁勋再度以他标志性的皮衣出场,在自家厨房召开了全球瞩目的发布会。自从去年新冠疫情肆虐开始,“厨房演讲”就成为了黄仁勋的又一标志,而就在这次 GTC2021 大会上,黄教主更是发布了三款 “激动人心” 的新品——专为TB级加速计算而设计的 CPU NVIDIA Grace、全新 BlueField-3 DPU 以及业界首款 1000TOPS 算力的自动驾驶汽车 SoC。更重要的是,在这次演讲中,表示将对包括未来英伟达的芯片架构进行重新打磨,以两年为一周期,在 x86 平台和 Arm 平台之间进行切换。

3U 一体,英伟达开创新纪元

3U一体(CPU,GPU,DPU)三种芯片,英伟达开创一个新纪元

结合发展路线图,我甚至从中看到了一点 TICK-TOCK 战略(即按年度在架构和工艺之间切换)的影子,而上一个提出这一想法的是摩尔定律的提出和践行者英特尔。不过我们都知道,受限于芯片工艺,英特尔早在 2015 年就放弃了对这一战略的坚持,而如今我们看到的英伟达显然已经有了自己的战略构想,甚至可能开启属于自己的 “定律时代”。

一直以来,大家对于英伟达的印象都是一家 GPU 加速计算解决方案提供商,尤其是在当下的智能化时代,我们通过英伟达的 GPU 进行加速计算而迈向了人工智能的新时代,机器学习、深度学习、神经网络等一系列名词都得益于 GPU 加速计算;而就在这大会上,英伟达出乎意料的 “三箭齐发”,特别是 CPU 和 DPU 的发布让业界看到了英伟达的改变——未来英伟达完全有能力基于自家产品打造含 CPU、GPU 和 DPU 在内的一站式解决方案,再也不需要借助于其他任何处理器或者任何平台。

至此,英伟达也成为了一家全栈计算加速解决方案提供商,官方自称是 “a full stack accelerated computing company”。从这个角度来说,英伟达已经成为集 CPU、GPU 和 DPU 于一体的厂商,也成为了未来数字化时代里必不可少的关键厂商之一。虽然大家普遍看好的 NVIDIA Grace 处理器来说,也有人更关注数据处理的 NVIDIA BlueField-3 DPU,很显然在海量数据浪潮的面前,专用优化的 DPU 才是未来的主力,就像 AI 时代的 GPU 一样。

3U一体(CPU,GPU,DPU)三种芯片,英伟达开创一个新纪元

相信很多人对于 CPU(中央处理器)已经非常熟悉了,毕竟大多数人开始接触电脑的时候 CPU 就已经成为了绝对的核心。但是伴随着计算力的提升,尤其是异构计算的发展,最近几年 GPU 加速计算成为了人工智能、深度学习和大数据分析应用的关键。在如今的大数据时代,我们的手机、平板电脑、智能设备等等每天都会产生大量的数据,按照 IDC 的预测到了 2025 年全球数据总量可以达到 175ZB,而要想妥善处理和应用这些数据,仅仅依靠当下的 CPU 和 GPU都不太可能,由此才有了 DPU 的概念 —— Data Processing Unit ,数据处理器。

DPU,数字时代的核心发动机

DPU 可以被看作是数据中心加速计算模型的第三个计算单元,用黄仁勋的话说则是“未来计算的三大支柱之一”。而它之所以被给予如此厚望,主要因为 DPU 是一种新型可编程处理器,它结合了行业标准的、高性能及软件可编程的多核 CPU 架构、高性能网络接口和各种灵活和可编程的加速引擎于一身,可以卸载 AI、机器学习、安全、电信和存储等应用,并提升性能。

比如我们刚刚提到的 BlueField-3 就是首款为 AI 和加速计算而设计的 DPU,它针对多租户、云原生环境进行了优化,提供数据中心级的软件定义和硬件加速的网络、存储、安全和管理等服务。作为业内首款 400G 以太网和 NDR InfiniBand DPU,BlueField-3 采用的是 ARM 架构,具备 16 颗物理核心和18M IOPs 弹性块存储,相比上一代产品来说其加速计算能力提升了 10 倍、加密速度提升了 4 倍。

3U一体(CPU,GPU,DPU)三种芯片,英伟达开创一个新纪元

如果你熟悉网络,又恰好用过 Mellanox 的网络设备,那你对于 “卸载” 这个词一定不会感到陌生。一直以来,我们都很信赖 CPU,也为 CPU 安排了许多的任务。纵然伴随着科技的发展,CPU 的算力越来越强,但不断增长的计算需求还是让处理器“压力山大”,很多时候许多业务不得不进行排队,尤其是对于处于“远端”的网络来说。

但是这种排队往往是致命的,会带来大量的时延,这也是网络厂商和用户都不能接受的。所以,网络企业就提供了 “卸载” 能力,在网卡上使用更智能、更强大的芯片,从而让业务不通过处理器本身而实现快速响应。这就相当于原本所有业务都在等公交车,这时候一个叫 “网络” 的小伙子开着汽车呼啸而过,那场面想想就觉得挺激动。

这就是 “卸载” 的价值所在。可以说,“卸载”是让处理器回归高级处理本质,让网络提升效率的最有效手段,而 “卸载” 能力的大小则与最终性能表现密切相关。在之前发布的 BlueField-2 上只提供 30 个 CPU 核心的 “卸载” 能力,而最新一代的 BlueField-3 则实现了 10 倍的加速计算性能提升,将这个数字提升到了 300 个 CPU 核心,并且在 ConnectX-7 网络芯片的加持下可以实现 400Gbps 的以太网或 InfiniBand 网络传输速率,这也就意味着无论是 “卸载 ” 能力还是 “卸载” 速度都获得了飞跃 —— 也就是我们前面提到的 “加速计算能力提升了 10 倍、加密速度提升了 4 倍”。

作为英伟达生态的一部分,这次发布的 BlueField-3 也同步提供了基于 NVIDIA DOCA(集数据中心于芯片的架构)软件开发包的下载,该开发包提供了用于配置、升级和监控整个数据中心数千个 DPU 的编排工具,以及各种库、 API 和日益增加的各种应用,如深度数据包检测和负载均衡等,是一套的软件平台。如此一来,开发者们就能根据为应用场景自定义需求,实现软件定义和硬件加速的网络、存储、安全和管理等应用,更好的利用 DPU 工具。

多应用扩展,英伟达让网络变得更安全

火车跑得快,全靠车头带。为了让 DPU 发挥出更大的价值,除了 DOCA 开发包之外,英伟达也在这次大会上发布了一款名为 NVIDIA Morpheus 的应用框架,旨在为网络安全合作伙伴提供一整套能够实时检测和预防安全威胁的加速 AI 技术。据悉,Morpheus 可以充分发挥 NVIDIA AI 计算和 NVIDIA BlueField-3 DPU 的优势,为用户提供从核心到边缘的数据中心保护能力。

虽然网络安全一直是整个行业的老生常谈,但是安全隐患本身却伴随着互联网的发展日新月异,攻击伪装得越来越好、病毒隐藏得越来越深、造成的损失也越来越大。据 2019 年全球互联网大会发布的报告指出,“为满足现有需求,网络安全人员数量需要增加 145%”,很显然整个产业无法在短期内增加足够的人手,而过重的人力资源负担也会造成整个行业的成本飙升。因此,要解决网络安全问题,不能依靠提升人力覆盖,而是需要借助于更智能化、技术化的手段来实现。

福瑞鑫智能科技

权威分析机构 Gartner 则给出了另一个方向。在 Gartner 发布的网络检测和响应(NDR)市场指南中,明确提到要“将机器学习等分析技术应用于网络流量的 NDR 技术能够帮助企业检测其他安全工具检测不到的安全威胁,手动和自动响应功能是这个进入门槛较低的市场的竞争焦点”。应该说,这是一条正确的道路,也有可能帮助整个产业实现网络安全管理的数字化与智能化。很显然,这次英伟达 Morpheus 应用框架的发展也迎合了这种趋势。

“零信任安全模式要求我们实时监测数据中心的每一个操作。这是一个重大的技术挑战 —— 必须在服务器内即刻感知入侵、发现威胁,且不影响现代数据中心的数据处理性能。NVIDIA Morpheus 结合了服务器内的 Mellanox 网络和 NVIDIA AI 技术,通过对完整数据包进行实时检查来预见威胁,达到了威胁一出现即被消灭的目的”,黄仁勋表示。相对于传统方式,这一解决方案的最大特性就是将数据中心的计算阶段变成了边缘网络防御传感器,在同一个网络架构内,企业无需复制数据,也能够以线速分析每个数据包,而传统的 AI 安全工具通常只能采样 5% 左右的网络流量数据,在安全效果上两者并不可同日而语。

福瑞鑫智能科技

更重要的是,作为应用框架,Morpheus 为开发者提供了深度学习的能力,任何人都可以基于模型创建自己的 Morpheus AI 功能,这样用户也就能够根据自己的应用场景选择最适合的方式,实现差异化。未来,通过在边缘和 AI 技术的结合,用户可以对网络安全实现实时的遥测、策略执行及操作,而这并不会影响到正在运行的业务和正在传输的数据,从而使得网络安全和数据分析变得更加智能和自由。

如今,英伟达正在与包括 ARIA Cybersecurity Solutions、Cloudflare、F5、Fortinet 和 Guardicore 等公司在内的多家行业安全巨头商讨合作内容,而包括 Canonical、Red Hat 和 VMware 等混合云平台解决方案供应商也表示将采用这一技术。我们相信未来这个数字还会不断的扩大,未来用户甚至在混合云端都可以即刻体验到这一技术,也可以获得最大限度的网络安全保障,实现业务高效、稳定、安全运行。

从计算到网络,从 GPU 到 CPU 和 DPU,英伟达构建的 “AI帝国” 已经初步完成。如果说最早是 CPU 在数据中心 “一统天下”,随后在 GPU 出现后变成了 “划江而治” 的话,那么 DPU 的发布更让这种关系变成了 “三足鼎立”,这也标志着英伟达以后的产品很难再 “假手他人”。或许未来,我们在选购计算设备的时候可以买到完全出自英伟达的整套解决方案,而这在不经意间就会改变原有的市场格局。

谁掌握了计算和数据,谁就掌握了未来。在这条道路上,英伟达已经先迈出了一步。

*本文转载自NVIDIA英伟达
电话咨询
最新产品
官方商城
QQ客服