最近文章

2025年 8月 13日
Dynamo 0.4 提供 4 倍性能提升、基于 SLO 的自动缩放和实时可观测性
最近几周,OpenAI 的 gpt-oss 和 Moonshot AI 的 Kimi K2 等几个前沿开源模型的出现,
2 MIN READ

2025年 8月 13日
借助 CUDA-QX 0.4 简化量子错误纠正和应用程序开发
随着量子处理器单元 (QPU) 制造商和算法开发者致力于打造大规模、商业上可行的量子超级计算机,他们越来越专注于量子纠错 (QEC) 。
2 MIN READ

2025年 8月 13日
使用 ProRL v2 通过长时间训练扩展 LLM 强化学习
目前,AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进,或者其能力是否最终会达到顶峰。
4 MIN READ

2025年 8月 13日
利用 Wheel Variant 简化 CUDA 加速 Python 的安装和打包工作流程
如果您曾经安装过 NVIDIA GPU 加速的 Python 软件包,您可能遇到过这样的场景:导航到 pytorch.org、jax.dev、
4 MIN READ

2025年 8月 11日
如何在交互式模拟中即时渲染现实世界场景
将现实世界环境转变为交互式仿真不再需要花费数天或数周的时间。借助 NVIDIA Omniverse NuRec 和…
2 MIN READ

2025年 8月 11日
通过后训练 NVIDIA Cosmos Reason 极大提升机器人性能
NVIDIA Cosmos Reason 是一个开放且完全可定制的物理 AI 和机器人视觉语言模型 (VLM) ,
2 MIN READ

2025年 8月 11日
开发者利用 NVIDIA Omniverse 库打造快速可靠的机器人模拟
在 SIGGRAPH 大会上,NVIDIA 发布了 NVIDIA Omniverse 库和 Cosmos 世界基础模型 (WFM) 的更新。
2 MIN READ

2025年 8月 8日
R²D²:利用 NVIDIA Research 的全球基础模型和工作流提升机器人训练效率
随着物理 AI 系统的进步,对丰富标记数据集的需求正在加速增长,超出了我们在现实世界中手动捕捉的能力。世界基础模型 (WFM)…
3 MIN READ

2025年 8月 7日
黑客如何利用 AI 解决问题的能力
随着多模态 AI 模型从感知发展到推理,甚至开始自主行动,新的攻击面也随之出现。这些威胁不仅针对输入或输出,还利用了 AI 系统如何处理、
2 MIN READ

2025年 8月 7日
在单个 NVIDIA Grace Hopper 超级芯片上使用 XGBoost 3.0 训练 TB 级数据集
梯度提升决策树 (GBDT) 驱动着从实时欺诈过滤到 PB 级需求预测的各种功能。由于其先进的准确性、
2 MIN READ

2025年 8月 7日
使用 JIT 编译在 cuDF 中高效转换
RAPIDS cuDF 提供了一系列用于使用 GPU 处理数据的 ETL 算法。对于 pandas 用户,
3 MIN READ

2025年 8月 6日
CUDA 工具包 13.0 的新特性和重要更新
CUDA Toolkit 13.0 是该工具包的最新版本,具有加速最新 NVIDIA CPU 和 GPU 计算的优势。作为一项重大发布,
4 MIN READ

2025年 8月 5日
NVIDIA vGPU 19.0 支持 NVIDIA Blackwell GPU 的图形和 AI 虚拟化功能
虚拟化长期以来一直承诺提高效率和可扩展性。然而,由于图形和计算工作负载的需求不断增加,以及需要找到经济高效的解决方案来提高用户密度,
2 MIN READ

2025年 8月 5日
NVIDIA 从云到边缘加速 OpenAI gpt-oss 模型部署,在 NVIDIA GB200 NVL72 上实现 150 万 TPS 推理
自 2016 年推出 NVIDIA DGX 以来,NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。
1 MIN READ

2025年 8月 4日
CUDA 专业提示:通过矢量化内存访问提高性能
许多 CUDA 内核受带宽限制,新硬件中 FLOPS 与带宽的比例不断增加,导致更多内核受带宽限制。因此,
2 MIN READ

2025年 8月 4日
如何使用 NVIDIA Llama Nemotron 模型通过推理增强 RAG 工作流
检索增强生成 (RAG) 系统面临的一大挑战是处理缺乏明确清晰度或带有隐含意图的用户查询。用户通常会以不准确的方式来表达问题。例如,
4 MIN READ