数据中心/云
2025年 1月 16日
借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
近年来,大语言模型(LLMs)在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而,尽管基础模型具有先进的功能,
4 MIN READ
2025年 1月 13日
借助 NVIDIA DOCA 平台框架,助力新一代 DPU 加速云基础设施
越来越多的企业组织开始采用加速计算来满足生成式 AI、5G 电信和主权云的需求。NVIDIA 发布了 DOCA 平台框架 (DPF),
2 MIN READ
2024年 12月 19日
聚焦:Stone Ridge Technology 利用 AWS 上的 NVIDIA Modulus 加速油藏模拟工作流
能源勘探中固有的风险和不确定性包括未知的地质参数、流体和岩石属性的变化、边界条件和噪声观测数据。
3 MIN READ
2024年 12月 18日
2024 年 NVIDIA 6G 开发者日的 5 大关键收获
2024 年 NVIDIA 6G 开发者日让 6G 研发社区成员共聚一堂 ,分享见解,并学习使用 NVIDIA 6G 研究工具的新方式。
3 MIN READ
2024年 12月 16日
2024 年热门文章:NVIDIA NIM、语言模型突破和数据科学优化的精要
对于使用 NVIDIA 技术的开发者、研究人员和创新者来说,2024 年又是具有里程碑意义的一年。
2 MIN READ
2024年 12月 12日
NVIDIA Air 简要介绍
AI 的出现带来了一种新型数据中心,即 AI 工厂 ,专门用于处理 AI 工作负载。AI 工作负载的范围和规模可能会有很大差异,
2 MIN READ
2024年 12月 12日
NVIDIA BlueField DPU 与 WEKA Client 的集成提升 AI 工作负载效率
WEKA 是可扩展软件定义数据平台的先驱,NVIDIA 正在携手合作,
1 MIN READ
2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。这些团队的任务是配置必要的硬件和软件来满足这一需求,
2 MIN READ
2024年 11月 21日
NVIDIA 和 Windows 365 共同推动 AI 智能工作负载发展
我们正在进入 AI 赋能数字工作流程的新时代,Windows 365 云 PC 是动态平台,托管 AI 技术并重塑传统流程。
3 MIN READ
2024年 11月 21日
利用 NVIDIA NIM 实现 AI 模型微调部署
对于使用特定领域数据调整 AI 基础模型的组织而言,快速创建和部署微调模型的能力是高效地通过企业生成式 AI 应用提供价值的关键。
2 MIN READ
2024年 11月 19日
Llama 3.2 全栈优化释放 NVIDIA GPU 的高性能
Meta 最近发布了 Llama 3.2 系列视觉语言模型(VLM),其中包含 11B 参数和 90B 参数变体。这些模型是多模态模型,
2 MIN READ
2024年 11月 18日
使用 nvmath-python 实现 Epilog 运算与矩阵乘法的融合计算
nvmath-python (Beta) 是一个开源 Python 库,为 Python 程序员提供对 NVIDIA CUDA-X…
4 MIN READ
2024年 11月 15日
借助 NVIDIA TensorRT-LLM 分块预填充提高 AI 推理效率和简化部署
在本 博文 中,我们详细介绍了分块预填充,这是 NVIDIA TensorRT-LLM 的一项功能,
1 MIN READ
2024年 11月 15日
NVIDIA NIM 1.4 现已部署可用,推理速度提升 2.4 倍
随着 生成式 AI 重塑各行各业,对可立即部署的高性能推理的需求也在不断增长。 NVIDIA NIM 为 AI…
1 MIN READ
2024年 11月 14日
NVIDIA DOCA 2.9 借助新性能和安全功能强化人工智能和云计算基础设施
NVIDIA DOCA 通过为开发者提供全面的软件框架来利用硬件加速来增强 NVIDIA 网络平台的功能,从而提高性能、安全性和效率。
2 MIN READ
2024年 11月 14日
探索采用自主 AI 和 NVIDIA 机密计算的超级协议案例
机密和自主的 AI 是一种新的 AI 开发、训练和推理方法,其中用户的数据是去中心化的、私有的,并由用户自己控制。
3 MIN READ