NeMo Curator

2025年 7月 22日

使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM

您是否曾想构建自己的推理模型，但认为它过于复杂或需要大量资源？再想想。借助 NVIDIA 强大的工具和数据集，

4 MIN READ

2025年 6月 26日

在 NVIDIA Jetson 和 RTX 上运行 Google DeepMind 的 Gemma 3n

截至今日，NVIDIA 现已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上个月，

1 MIN READ

2025年 6月 25日

提高嵌入模型准确性，实现定制化信息检索

自定义嵌入模型对于有效的信息检索至关重要，尤其是在处理法律文本、病历或多轮客户对话等特定领域的数据时。通用、

2 MIN READ

2025年 6月 17日

微调 LLMOps 以实现快速模型评估和持续优化

大语言模型 (LLM) 为各行各业带来了前所未有的机遇。然而，将 LLM 从研发转向可靠、可扩展和可维护的生产系统会带来独特的运营挑战。

4 MIN READ

2025年 5月 14日

使用先进的开放式后训练数据集构建自定义推理模型

合成数据已成为大语言模型 (LLM) 后训练程序的标准组成部分。使用从单个或一组经商业许可的开源 LLM 中合成生成的大量示例，

2 MIN READ

2025年 5月 7日

使用 NVIDIA NeMo Curator 构建 Nemotron-CC：一个高质量万亿令牌数据集，用于大型语言模型预训练，源自 Common Crawl

对于想要训练先进的大语言模型 (LLM) 的企业开发者而言，整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM，

2 MIN READ

2025年 4月 23日

使用 NVIDIA NeMo 微服务，通过数据飞轮增强 AI 智能体

企业数据不断变化。随着时间的推移，这给保持 AI 系统的准确性带来了重大挑战。随着企业组织越来越依赖代理式 AI 系统来优化业务流程，

4 MIN READ

2025年 4月 7日

使用合成数据评估和增强 RAG 工作流性能

随着大语言模型 (LLM) 在各种问答系统中的普及，检索增强生成 (RAG) 流程也成为焦点。

1 MIN READ

2025年 4月 5日

NVIDIA 加速推理 Meta Llama 4 Scout 与 Maverick 模型

最新一代热门 Llama AI 模型现已支持 Llama 4 Scout 和 Llama 4 Maverick。

2 MIN READ

2025年 3月 25日

借助 SES AI 的 NVIDIA 驱动的电动汽车创新技术，加速运输业的未来发展

电动汽车 (EV) 正在改变交通运输方式，但成本、使用寿命和续航里程等挑战仍然是广泛采用电动汽车的障碍。这些挑战的核心在于电池技术，

2 MIN READ

2025年 3月 18日

在 NVIDIA DGX 云上使用 NVIDIA NeMo Curator 处理 PB 级视频

随着物理 AI 的兴起，视频内容生成呈指数级增长。一辆配备摄像头的自动驾驶汽车每天可生成超过 1 TB 的视频，

3 MIN READ

2025年 1月 13日

使用 NVIDIA NeMo Curator 提高生成式 AI 模型的准确性

在快速发展的人工智能领域，用于训练模型的数据质量至关重要。高质量数据可确保模型准确、可靠，并且能够在各种应用中很好地泛化。

1 MIN READ

2025年 1月 9日

宣布推出 Nemotron-CC：用于 LLM 预训练的万亿级英语语言数据集

NVIDIA 很高兴地宣布发布 Nemotron-CC，这是一种包含 6.3 万亿个令牌的英语语言 Common Crawl 数据集，

1 MIN READ

2025年 1月 9日

NVIDIA Cosmos World 基础模型平台助力物理 AI 进步

随着机器人和自动驾驶汽车的发展，加速物理 AI 的发展变得至关重要，而物理 AI 使自主机器能够感知、理解并在现实世界中执行复杂的操作。

4 MIN READ

2024年 12月 19日

使用 NVIDIA NeMo Curator 新分类器模型增强您的训练数据

分类器模型专门用于将数据分类为预定义的组或类，在优化数据处理流程以微调和预训练生成式 AI 模型方面发挥着关键作用。

3 MIN READ

2024年 11月 19日

NVIDIA NeMo Curator 实现高质量越南语数据处理

开源大语言模型（LLMs）在英语方面表现出色，但难以与其他语言（尤其是东南亚语言）搭配使用。这主要是由于缺乏这些语言的训练数据、

6 MIN READ