生成式人工智能/大语言模型

2025年 6月 4日
通过自校正 AI 工作流简化交易捕获和评估
LLM 在聊天和数字助理应用中的成功让人们对其在业务流程自动化方面的潜力寄予厚望。虽然在此类工作流程中实现人类水准的可靠性一直具有挑战性,
2 MIN READ

2025年 6月 4日
NVIDIA Blackwell 在 MLPerf Training v5.0 中实现高达 2.6 倍的性能提升
创建先进的大语言模型 (LLM) 的过程始于预训练过程。预训练最先进的模型具有很高的计算要求,因为热门的开放权重模型具有数百亿到数千亿个参数,
3 MIN READ

2025年 6月 4日
重现 NVIDIA MLPerf v5.0 的 LLM 基准测试训练成绩
运行 NVIDIA 基准测试时,您的系统需要具备以下内容: 运行 NVIDIA MLPerf 训练基准测试需要:
4 MIN READ

2025年 6月 3日
全新 NVIDIA Llama Nemotron Nano 视觉语言模型在 OCR 准确性基准测试中位居榜首
PDF、图形、图表和控制面板等文档是丰富的数据源,在提取和整理时,可提供信息丰富的决策见解。从自动化财务报表处理到改进商业智能工作流程,
2 MIN READ

2025年 5月 30日
借助 NVIDIA NIM 加速 Vanna 上的文本到 SQL 推理,从而提升分析效率
从自然语言输入生成查询缓慢且效率低下,是决策制定的瓶颈。这迫使分析师和业务用户严重依赖数据团队,从而延迟洞察并限制敏捷性。
4 MIN READ

2025年 5月 30日
人工智能聚焦珊瑚礁生态系统
研究人员推出了一种新的 AI 模型,可以将难以看到的水下图像转换为清晰、高度准确的 3D 场景。
1 MIN READ

2025年 5月 30日
在阿里云 PAI 上一键部署和使用 NVIDIA Cosmos Reason-1 模型
NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI…
3 MIN READ

2025年 5月 28日
聚焦:使用 Iguazio 的 MLRun 和 NVIDIA NIM 构建可扩展和可观察的 AI 以投入生产
Iguazio (被麦肯锡收购) 与 NVIDIA 的合作使企业组织能够构建生产级 AI 解决方案,这些解决方案不仅具有高性能和可扩展性,
2 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上分析大型语言模型训练工作流
AI 的快速发展催生了模型大小呈指数级增长的时代,特别是在大语言模型 (LLMs) 领域。这些模型凭借其变革能力,正在推动各行各业的创新。
3 MIN READ

2025年 5月 27日
在 NVIDIA Grace Hopper 上训练大型语言模型的高级优化策略
虽然分析有助于识别效率低下的情况,但高级优化策略对于解决硬件限制和有效扩展 AI 工作负载至关重要。在本文中,我们将探讨 CPU 卸载、
3 MIN READ

2025年 5月 23日
AI 将脑部 MRI 转化为潜在的中风预测因子
研究人员使用 AI 分析常规脑部扫描,发现了一种前景良好的新方法,可以可靠地识别常见但难以检测的多中风先兆。
1 MIN READ

2025年 5月 23日
更智能、更安全地串流:了解 NVIDIA NeMo Guardrails 如何增强 LLM 输出串流
LLM 流式传输会在生成模型响应时,逐个 token 实时递增发送该响应。
2 MIN READ

2025年 5月 23日
LLM 推理、AI 智能体和测试时间缩放的简单介绍
智能体一直是应用大语言模型 (LLMs) 解决复杂问题的主要驱动力。自 2023 年 AutoGPT 以来,
2 MIN READ

2025年 5月 22日
Blackwell 借助 Meta 的 Llama 4 Maverick 突破 1000 TPS/ 用户门槛
NVIDIA 的大语言模型 (LLM) 推理速度创下了世界纪录。在包含 400 亿参数的 Llama 4 Maverick 模型 (…
3 MIN READ

2025年 5月 21日
NVIDIA Dynamo 加速 llm-d 社区计划,推动大规模分布式推理
在 Red Hat Summit 2025 上推出的 llm-d 社区标志着开源生态系统在加速生成式 AI 推理创新方面迈出了重要一步。
1 MIN READ

2025年 5月 20日
NVIDIA Dynamo 新增 GPU 自动缩放、Kubernetes 自动化和网络优化功能
在 NVIDIA GTC 2025 上,我们宣布推出 NVIDIA Dynamo ,这是一种高吞吐量、低延迟的开源推理服务框架,
2 MIN READ