-
生成式人工智能/大语言模型FP8 在大模型训练中的应用、挑战及实践
-
生成式人工智能/大语言模型构建 AI 销售助理的经验教训
-
生成式人工智能/大语言模型NVIDIA TensorRT-LLM 在推荐广告及搜索广告的生成式召回的加速实践
-
AI 平台/部署借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
-
网络安全/欺诈检测如何使用 NVIDIA NeMo Guardrails 为客户服务保护 AI 智能体
最近
2025年 1月 24日
FP8 在大模型训练中的应用、挑战及实践
越来越多的技术团队开始使用 FP8 进行大模型训练,这主要因为 FP8 有很多技术优势,比如在新一代的 GPU 上,
3 MIN READ
2025年 1月 21日
构建 AI 销售助理的经验教训
在 NVIDIA,销售运营团队为销售团队提供将先进的硬件和软件推向市场所需的工具和资源。
3 MIN READ
2025年 1月 20日
NVIDIA TensorRT-LLM 在推荐广告及搜索广告的生成式召回的加速实践
推荐系统的主要任务是根据用户的历史行为预测其兴趣点,并向其推荐相应的商品。传统的推荐系统在处理用户请求时,
2 MIN READ
2025年 1月 16日
借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
近年来,大语言模型(LLMs)在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而,尽管基础模型具有先进的功能,
4 MIN READ
2025年 1月 16日
如何使用 NVIDIA NeMo Guardrails 为客户服务保护 AI 智能体
AI 代理为 企业扩展和提升客户服务以及支持交互提供了重要机会。这些客服人员可自动处理日常查询并缩短响应时间,从而提高效率和客户满意度,
5 MIN READ
2025年 1月 16日
利用 RAPIDS cuML 加速时间序列预测
时间序列预测是一种强大的数据科学技术,用于根据过去的数据点预测未来值 借助 skforecast 等开源 Python 库,
2 MIN READ
2025年 1月 16日
AI 揭露被遗忘的潜在有害油气井
劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory) 的研究人员在美国各地散布着多达 80…
1 MIN READ
2025年 1月 16日
NVIDIA JetPack 6.2 为 NVIDIA Jetson Orin Nano 和 Jetson Orin NX 模块引入超级模式
NVIDIA Jetson Orin Nano 超级开发者套件 的推出为小型边缘设备开启了 生成式 AI 的新时代。
7 MIN READ
2025年 1月 16日
在 NVIDIA TensorRT-LLM 中引入新型 KV 缓存重用优化策略
语言模型通过预测下一个令牌 (给定所有先前的令牌,包括输入文本令牌) 来生成文本。在 LLM 服务中,先前令牌的键和值元素用作历史语境,
2 MIN READ
2025年 1月 15日
提升 AI 性能的 GPU 内存基础知识
生成式 AI 彻底改变了人们将想法变为现实的方式,而代理 AI 代表着这一技术变革的下一次飞跃。通过利用复杂的自主推理和迭代规划,
2 MIN READ
2025年 1月 15日
利用 AI 驱动的洪水建模和 3D 可视化技术增强气候韧性
AI 驱动的洪水建模和 3D 可视化工具正在改变社区应对气候风险的方式。在这场 NVIDIA GTC 2024 会议中,
1 MIN READ
2025年 1月 14日
将数据中心转变为 AI 工厂,迎接第 5 次工业革命
在最近的 DC Anti-Conference Live 演示中,NVIDIA 首席数据中心杰出工程师 Wade Vinson 分享了基于…
1 MIN READ
增强现实/虚拟现实
2025年 1月 6日
利用 NVIDIA Omniverse 空间流,在 XR 中体验数字孪生技术
空间计算 体验正在转变我们与数据的交互方式,通过 扩展现实 (XR) 和 数字孪生 等技术连接物理和数字世界。
2 MIN READ
2024年 10月 24日
利用 NVIDIA Morpheus 加速警报分流和 LLM 代理强化安全运营中心
安全运营中心(SOC)分析师每天都会收到大量传入的安全警报。为了确保其组织的持续安全,他们的任务是仔细检查传入的噪音,分拣出误报,
1 MIN READ
2024年 10月 22日
多代理 AI 和 GPU 驱动的声音转文本技术创新
自动音频字幕 (Automated Audio Captioning) 任务的核心是从音频输入中生成自然语言描述。鉴于输入 (音频) 和输出…
2 MIN READ
2024年 10月 14日
AI 驱动模拟和数字孪生技术助力手术机器人技术创新发展
在手术室中集成机器人手术助手(RSAs)为外科医生和患者的治疗效果带来了巨大的优势。目前,
1 MIN READ
2024年 7月 29日
利用 NVIDIA Omniverse 新开发者工具将生成式 AI 整合到 OpenUSD 工作流程
在 SIGGRAPH 2024 大会上,NVIDIA 宣布推出基于 NVIDIA Omniverse 的新型生成式 AI 和基于…
2 MIN READ
2024年 6月 14日
使用人工智能开发更小、更轻的扩展现实眼镜
如今的沉浸式扩展现实(XR)设备需要重型光学器件和显示器用头带固定,这增加了体积并形成了社会障碍。在设想的未来,头带将不再是必要的。
2 MIN READ
2024年 6月 6日
使用 NVIDIA RTX Video SDK 增强低分辨率 SDR 视频
NVIDIA RTX 视频是 AI 视频增强功能的集合,可改善低质量视频的视觉质量。 NVIDIA RTX 视频最初作为驱动 API 发布,
1 MIN READ
2024年 4月 25日
广播行业的突破:NVIDIA Holoscan for Media 现已上市,并将通过简化 AI 集成来深入改变直播媒体
该软件定义平台帮助全球广播和流媒体领域的开发者实现 AI 赋能的媒体解决方案。 无论是提供体育直播节目、流媒体服务、网络广播还是社交平台内容,
1 MIN READ
2024年 4月 18日
借助 NVIDIA NeMo Parakeet ASR 模型突破语音识别的界限
NVIDIA NeMo Parakeet 是一个端到端平台,用于在任何地方(任何云端和本地)大规模开发多模态生成式 AI 模型,
2 MIN READ
2024年 3月 1日
通过线下实践学习,充分利用 NVIDIA GTC 2024
我们很高兴能在圣何塞会议中心参加今年的 GTC 大会,与数千名开发者、行业领导者、研究人员和合作伙伴共襄盛会。通过亲自参加 GTC,
1 MIN READ
2024年 2月 22日
借助由 NVIDIA 提供支持的新款 Varjo XR-4 系列头显设备,增强沉浸式体验
借助集成 NVIDIA 技术的 Varjo 新款 XR-4 系列头显设备,开发者和企业现在可以部署如生的虚拟现实和混合现实体验。
1 MIN READ
2023年 12月 15日
高级 API 性能:交换链
交换链是如何将渲染数据输出到屏幕的不可或缺的一部分。它们通常由一组输出就绪型缓冲区组成,每个缓冲区都可以旋转渲染为一个缓冲区。
1 MIN READ
数据科学
2025年 1月 16日
利用 RAPIDS cuML 加速时间序列预测
时间序列预测是一种强大的数据科学技术,用于根据过去的数据点预测未来值 借助 skforecast 等开源 Python 库,
2 MIN READ
2025年 1月 16日
AI 揭露被遗忘的潜在有害油气井
劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory) 的研究人员在美国各地散布着多达 80…
1 MIN READ
2025年 1月 13日
借助 NVIDIA BioNeMo Blueprint 加速蛋白质工程中的生成式蛋白质粘结剂设计
设计一种能在药物研发中专门结合标的治疗性蛋白质是一项艰巨的挑战。传统工作流程通常是一个艰苦的试错过程,需要对数千个候选项进行迭代,
1 MIN READ
2025年 1月 13日
评估 GenMol 作为用于分子生成的通用基础模型
传统的计算药物研发几乎完全依赖于高度特定于任务的计算模型来识别命中率和优化潜在客户。使这些专业模型适应新任务需要大量的时间、
2 MIN READ
2025年 1月 13日
使用 NVIDIA NeMo Curator 提高生成式 AI 模型的准确性
在快速发展的人工智能领域,用于训练模型的数据质量至关重要。高质量数据可确保模型准确、可靠,并且能够在各种应用中很好地泛化。
1 MIN READ
2024年 12月 20日
NVIDIA 黑客松获奖者分享 RAPIDS 加速机器学习工作流程的策略
今年,大约 220 个团队齐聚开放数据科学大会 (ODSC) 西部,参加 NVIDIA 黑客松竞赛,这是一场 24 小时机器学习 (ML)…
3 MIN READ
2024年 12月 20日
利用 RAPIDS 和 Ray 加速 GPU 数据分析
RAPIDS 是一套开源 GPU 加速的数据科学和 AI 库,可通过 Spark 和 Dask 等分布式引擎进行横向扩展。
2 MIN READ
2024年 12月 19日
RAPIDS 24.12 推出基于 PyPI 的 cuDF、适用于 Polar 的 CUDA 统一内存和更快的 GNN
RAPIDS 24.12 将 cuDF 包引入 PyPI,加快了 聚合和从 AWS S3 读取文件的速度,
3 MIN READ
2024年 12月 19日
使用 NVIDIA NeMo Curator 新分类器模型增强您的训练数据
分类器模型专门用于将数据分类为预定义的组或类,在优化数据处理流程以微调和预训练生成式 AI 模型方面发挥着关键作用。
3 MIN READ
2024年 12月 18日
利用 XGBoost 中的 CUDA 加速同态加密实现联邦学习数据隐私安全性
XGBoost 是一种广泛用于表格数据建模的机器学习算法。为了将 XGBoost 模型从单站点学习扩展到多站点协作训练,
3 MIN READ
2024年 12月 16日
2024 年热门文章:NVIDIA NIM、语言模型突破和数据科学优化的精要
对于使用 NVIDIA 技术的开发者、研究人员和创新者来说,2024 年又是具有里程碑意义的一年。
2 MIN READ
2024年 12月 12日
利用 RAPIDS cuML 和 GPU 加速提升多标签分类性能
现代分类工作流程通常需要将单个记录和数据点分类为多个类别,而不仅仅是分配单个标签。 借助 scikit-learn 等开源 Python 库,
1 MIN READ