最AI前沿,NVIDIA多款全新AI工具和技术盘点

2021-05-27 11:41:54

GTC 2021上NVIDIA推出了多款全新软件工具帮助开发者构建优化的对话式AI、推荐系统和视频解决方案。

最AI前沿,NVIDIA多款全新AI工具和技术盘点

1


NVIDIA Jarvis

NVIDIA宣布在NVIDIA Jarvis中推出主要对话式AI功能,这将帮助企业为其客户构建极具吸引力的准确应用程序。通过高度精确的自动语音识别、多语言实时翻译和语音合成功能,创建表达对话式AI代理。


【亮点】

  • 基于多个大型语料库训练的开箱即用的语音识别模型,准确率超过90%

  • TAO中的迁移学习工具包,用于微调任何领域的模型

  • 5种语言的实时翻译,每句延迟小于100毫秒

  • 富于表现力的语音合成功能,与Tacotron2相比,吞吐量提高了30倍


这些新特征将于2021年第2季度发布,是现行NVIDIA Jarvis公测计划的组成部分。


【资源】

NVIDIA Jarvis开发者博客——包含Jarvis的介绍和构建对话式AI 应用程序的教程:

https://developer.nvidia.com/blog/tag/jarvis/

2

NVIDIA TAO 框架——Early Access

NVIDIA宣布推出TAO(集训练、调整和优化功能),这是一个基于GUI、工作流驱动的框架,可以简化和加速企业AI应用程序和服务的创建。通过微调预训练模型,企业在几个小时内即可生成特定领域的模型,无需大量训练和深度AI专业知识。

NVIDIA TAO简化了深度学习工作流程中耗时的环节,包括数据准备、训练和优化,缩短了数据变现的时间。

【亮点】

  • 可访问各种经过预训练的模型,包括语音、视觉、自然语言理解等

  • 借助NVIDIA经过预训练的模型和TLT,将AI开发速度提高10倍以上

  • 通过联邦学习提高模型性能,同时保护数据隐私

  • 利用NVIDIA TensorRT优化模型,实现高吞吐量、低延迟推理

  • 借助NVIDIA Triton推理服务器,在CPU或GPU上实现任何型号架构的最佳配置部署

  • 借助NVIDIA Fleet Command,无缝部署和协调AI应用程序

【资源】

申请NVIDIA TAO的Early Access:

https://developer.nvidia.com/TAO-early-access

3

NVIDIA Maxine——现可下载

NVIDIA宣布推出NVIDIA Maxine SDK,开发者使用这些软件开发套件来构建创新的虚拟协作和内容创建应用程序,例如视频会议和直播。Maxine中采用的先进AI技术经过高度优化,可以实现在PC和数据中心的GPU上提供尽可能高的性能。

【亮点】

  • 视频效果SDK:超分辨率、视频降噪、虚拟背景

  • 增强现实SDK:3D效果,例如面部和身体姿态追踪

  • 音频效果SDK:高质量去噪和室内回声消除

此外,NVIDIA还宣布推出AI Face Codec,这是NVIDIA研发的一种基于AI的全新解决方案,用于压缩视频以及为视频会议渲染人脸。与H.264相比,它可以最多可将带宽减少10倍。

开发者们开发基于Maxine的应用程序时,可使用Jarvis的实时转录、翻译和虚拟助手功能。

【资源】

  • 了解Maxine的更多信息:

    https://developer.nvidia.com/maxine-getting-started

  • 使用NVIDIA Maxine,借助AI重塑视频会议、内容创作和流式传输:

    https://www.youtube.com/watch?v=vh-noM8p8Ss

4

NVIDIA Triton 推理服务器 2.9

NVIDIA宣布推出最新版本的Triton推理服务器。Triton是一款开源推理服务软件,可最大限度地提高性能并简化大规模生产部署。

【亮点】

  • Model Navigator是Triton(内测版)中的一个新工具,可自动将TensorFlow和PyTorch模型转换为TensorRT计划、验证准确性,并设置部署环境。

  • Model Analyzer目前可以根据延迟或吞吐量目标,自动确定最佳批处理大小和并发模型实例的数量,以最大限度地提高性能。

  • 支持OpenVINO后端(测试版),从而在CPU上实现高性能推理、支持Windows Triton(内测版),支持与MLOps平台Seldon和Allegro的集成。

【资源】

  • 从NGC下载Triton:

    https://ngc.nvidia.com/catalog/containers/nvidia:tritonserver

  • 在GitHub访问代码和文档:

    https://github.com/triton-inference-server/server

5

TensorRT 8.0

NVIDIA宣布推出TensorRT 8.0,这是其高性能深度学习推理SDK的最新版本。TensorRT包括深度学习推理优化器和运行时,为深度学习推理优化提供低延迟和高吞吐量。借助新的功能和优化,推理应用程序现在能够以INT8的精度,将运行速度提高2倍,准确性达到FP32。

【亮点】

  • 量化感知训练,以INT8精度达到FP32的准确性

  • 支持Ampere GPU上的稀疏性,从而将Ampere GPU的吞吐量提高了50%

  • 通过新的编译器优化,基于Transformer的网络(例如BERT)推理速度可提高2倍

【资源】

TensorRT 8将于2021年第2季度在TensorRT页面推出。TensorRT开源repo中始终提供最新版本的示例、解析器和笔记本。

6

NVIDIA Merlin 端到端加速推荐系统

NVIDIA宣布推出NVIDIA Merlin的最新版本,这是一个公测版应用框架,支持深度学习推荐系统的端到端开发,从数据预处理到模型训练和推理,均可在NVIDIA GPU上实现加速。在这一版本中,Merlin提供了全新API和推理支持,从而简化了推荐系统工作流。

【亮点】

  • 借助全新Merlin API,轻松定义工作流程和训练流程

  • 深化对推理和集成Triton推理服务器的支持

  • 透明地扩展到更大的数据集和更复杂的模型

【资源】

  • Merlin初学者工具包

    https://www.nvidia.com/en-us/merlin-starter-kit/

  • 借助NVIDIA Merlin公测版加速推荐系统训练

    https://developer.nvidia.com/blog/accelerating-recommender-systems-training-with-nvidia-merlin-open-beta

  • 发布NVIDIA NVTabular公测版,支持多GPU并具备全新数据加载器

    https://resources.nvidia.com/en-us-merlin/nvtabular-open-beta-blog?lx=97GH0Q%E2%80%9D

7

为迁移学习工具包推出数据标签和注释合作伙伴服务

NVIDIA宣布将与六家领先的NVIDIA合作伙伴合作,为数据标签提供解决方案,使预训练模型易于适应特定的领域数据,并快速有效地进行训练。这些公司包括AI Reverie、Appen、Hasty、ai、Labelbox、Sama和Sky Engine。

训练可靠的AI和机器学习模型需要大量精确标记的数据,而大规模获取标记和注释的数据对一些企业来说极具挑战。通过集成,开发者可使用配备了NVIDIA迁移学习工具包 (TLT) 的合作伙伴服务和平台进行注释,利用合作伙伴与TLT的合成数据,或者使用外部注释工具,将数据导入TLT进行训练和模型优化。

【资源】

如欲了解有关集成的更多信息,请阅读开发者博客:


  • 集成数据生成和标签工具,进行精确的AI训练

    https://developer.nvidia.com/blog/integrating-with-data-generation-and-labeling-tools-for-accurate-ai-training/

  • 下载迁移学习工具包:

    https://developer.nvidia.com/tlt-get-started

8

DeepStream 6.0

NVIDIA DeepStream SDK是AI流式分析工具包,用于构建高性能、低延迟、复杂的视频分析应用程序和服务。NVIDIA宣布推出 DeepStream 6.0。这一最新版本推出了全新的图形用户界面,能够帮助开发者更快地构建可靠的AI应用程序,并快速跟踪从原型制作到在边缘和云端部署的整个工作流程。借助全新的GUI和生产力工具套件,几天内即可构建AI应用程序,无需耗费数周时间。

【资源】

Early Access计划的通知:

https://developer.qa.nvidia.com/deepstream-notifications

电话咨询
最新产品
官方商城
QQ客服