NeMo Curator

2025年 7月 22日
使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM
您是否曾想构建自己的推理模型,但认为它过于复杂或需要大量资源?再想想。借助 NVIDIA 强大的工具和数据集,
4 MIN READ

2025年 6月 26日
在 NVIDIA Jetson 和 RTX 上运行 Google DeepMind 的 Gemma 3n
截至今日,NVIDIA 现已支持在 NVIDIA RTX 和 Jetson 上全面推出 Gemma 3n。上个月,
1 MIN READ

2025年 6月 25日
提高嵌入模型准确性,实现定制化信息检索
自定义嵌入模型对于有效的信息检索至关重要,尤其是在处理法律文本、病历或多轮客户对话等特定领域的数据时。通用、
2 MIN READ

2025年 6月 17日
微调 LLMOps 以实现快速模型评估和持续优化
大语言模型 (LLM) 为各行各业带来了前所未有的机遇。然而,将 LLM 从研发转向可靠、可扩展和可维护的生产系统会带来独特的运营挑战。
4 MIN READ

2025年 5月 14日
使用先进的开放式后训练数据集构建自定义推理模型
合成数据已成为大语言模型 (LLM) 后训练程序的标准组成部分。使用从单个或一组经商业许可的开源 LLM 中合成生成的大量示例,
2 MIN READ

2025年 5月 7日
使用 NVIDIA NeMo Curator 构建 Nemotron-CC:一个高质量万亿令牌数据集,用于大型语言模型预训练,源自 Common Crawl
对于想要训练先进的 大语言模型 (LLM) 的企业开发者而言,整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM,
2 MIN READ

2025年 4月 23日
使用 NVIDIA NeMo 微服务,通过数据飞轮增强 AI 智能体
企业数据不断变化。随着时间的推移,这给保持 AI 系统的准确性带来了重大挑战。随着企业组织越来越依赖 代理式 AI 系统 来优化业务流程,
4 MIN READ

2025年 4月 7日
使用合成数据评估和增强 RAG 工作流性能
随着 大语言模型 (LLM) 在各种问答系统中的普及, 检索增强生成 (RAG) 流程也成为焦点。
1 MIN READ

2025年 4月 5日
NVIDIA 加速推理 Meta Llama 4 Scout 与 Maverick 模型
最新一代热门 Llama AI 模型现已支持 Llama 4 Scout 和 Llama 4 Maverick。
2 MIN READ

2025年 3月 25日
借助 SES AI 的 NVIDIA 驱动的电动汽车创新技术,加速运输业的未来发展
电动汽车 (EV) 正在改变交通运输方式,但成本、使用寿命和续航里程等挑战仍然是广泛采用电动汽车的障碍。这些挑战的核心在于电池技术,
2 MIN READ

2025年 3月 18日
在 NVIDIA DGX 云上使用 NVIDIA NeMo Curator 处理 PB 级视频
随着 物理 AI 的兴起,视频内容生成呈指数级增长。一辆配备摄像头的自动驾驶汽车每天可生成超过 1 TB 的视频,
3 MIN READ

2025年 1月 13日
使用 NVIDIA NeMo Curator 提高生成式 AI 模型的准确性
在快速发展的人工智能领域,用于训练模型的数据质量至关重要。高质量数据可确保模型准确、可靠,并且能够在各种应用中很好地泛化。
1 MIN READ

2025年 1月 9日
宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集
NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 ,
1 MIN READ

2025年 1月 9日
NVIDIA Cosmos World 基础模型平台助力物理 AI 进步
随着机器人和 自动驾驶汽车 的发展,加速 物理 AI 的发展变得至关重要,而物理 AI 使自主机器能够感知、理解并在现实世界中执行复杂的操作。
4 MIN READ

2024年 12月 19日
使用 NVIDIA NeMo Curator 新分类器模型增强您的训练数据
分类器模型专门用于将数据分类为预定义的组或类,在优化数据处理流程以微调和预训练生成式 AI 模型方面发挥着关键作用。
3 MIN READ

2024年 11月 19日
NVIDIA NeMo Curator 实现高质量越南语数据处理
开源大语言模型(LLMs) 在英语方面表现出色,但难以与其他语言(尤其是东南亚语言)搭配使用。这主要是由于缺乏这些语言的训练数据、
6 MIN READ