视频和音频解决方案
NVIDIA 的 AI 赋能 SDK 用于构建 GPU 加速的多媒体处理应用,可提供实时解决方案,用于增强、修改和优化音频和视频质量。这些 SDK 打包成两个核心直播和视频会议产品(NVIDIA Broadcast Engine 和 NVIDIA Maxine™),可帮助开发者改进直播、内容创建以及视频会议应用和平台。

面部和身体追踪
借助 AR SDK,开发者可以使用标准网络摄像头对人脸和身体进行实时 3D 追踪,从而打造有趣且引人入胜的增强现实 (AR) 效果。

音频增强功能
借助 Audio Effects SDK,开发者能够利用 AI 消除背景干扰噪音,将音频中的人声与传入和/或传出的音频源隔离开来。

超高分辨率和虚拟背景
借助 Video Effects SDK,开发者可以利用 AI 实时提升视频分辨率并提供虚拟背景,优化观看体验。

视频和图像分析
DeepStream SDK 提供完整的串流分析工具套件,可用于基于 AI 的多传感器处理以及视频和图像理解。

对话式 AI
Riva SDK 是一种应用框架,能够用于在 GPU 上提供实时性能的多模态对话式 AI 服务。

基于语音的面部动画
Audio2Face SDK 是一款 AI 赋能的应用,仅基于一个音频来源即可生成面部表情动画。

适用于 Windows Machines 的直播
NVIDIA Broadcast Engine 是一系列 SDK,可为在本地 Windows 机器上使用 AI 的开发者提供 AI 赋能的广播、内容创建和视频会议功能。
了解详情
核心视频技术
探索作为所有视频解决方案的基础的硬件加速技术。这项技术利用新的 NVIDIA 体系架构,并释放 GPU 和 CPU 来执行其他操作,从而为开发者创建应用提供更强大的计算功能。
视频编码和解码
Video Codec SDK 是一套全面的 API(包含高性能工具、样本和文档),用于在 Windows 和 Linux 上执行硬件加速视频编码和解码。
图形和计算
Vulkan API 是新一代图形和计算开放标准 API,可对现代 GPU 实现跨平台高效访问。
准确的流向量
Optical Flow SDK 使用复杂算法来生成高度精确的流向量,这些向量对于帧到帧的强度变化具有鲁棒性,并可追踪真实的物体运动。
高性能数据传输
Rivermax SDK 支持直接向 GPU 来回传输数据,为串流工作负载提供出色的吞吐量和延迟,并尽可能降低 CPU 利用率。
加速游戏资产加载和解压缩
NVIDIA RTX™ IO 支持基于 GPU 的快速加载和游戏资产解压缩,与硬盘和传统存储 API 相比,可将 IO 性能提升高达 100 倍。
低延迟 IO 和 GPU/CPU 同步
GPUDirect® for Video 允许第三方硬件与 NVIDIA GPU 进行高效通信,通过将 IO 设备与 GPU 和 CPU 同步来更大限度地减少历史延迟问题。
GPU 和存储之间的直接传输
GPUDirect Storage 支持在 GPU 显存与存储之间进行直接显存访问 (DMA) 传输的直接数据路径,从而避免通过 CPU 的反弹缓冲区。