cuSPARSE

用于稀疏计算的 GPU 库 API。
cuSPARSE 主机 API 提供 GPU 加速的基本线性代数例程,cuSPARSELt 主机 API 提供结构化稀疏支持,可利用稀疏张量核心实现 GEMM。稀疏技术在机器学习、AI、计算流体动力学、地震勘探和计算科学领域得到广泛应用。

cuSPARSE 主机 API

下载 文档

cuSPARSE API 提供 GPU 加速的基本线性代数子例程,用于结构化稀疏矩阵计算。cuSPARSE 广泛应用于机器学习、AI、计算流体动力学、地震勘探和计算科学领域的工程师和科学家。


cuSPARSE 已包含在 NVIDIA HPC SDK 以及 CUDA 工具包

cuSPARSELt 主机 API

下载 文档

cuSPARSELt API 通过 Ampere 和后续架构中的稀疏张量核心为通用矩阵乘法 (GEMM) 提供 2:4 结构化稀疏支持。cuSPARSELt API 为 AI 和深度学习用例提供了剪枝和压缩稀疏矩阵、激活函数、偏差向量和输出缩放的选项。


cuSPARSE 性能

cuSPARSE 库针对 NVIDIA GPU 的性能进行了高度优化,SpMM 性能比仅使用 CPU 的替代方案快 30 到 150 倍。

cuSPARSE 主要特性

  • 支持密集、COO、CSR、CSC 和屏蔽 CSR 稀疏矩阵格式
  • 全套稀疏例程,涵盖稀疏向量 x 密集向量运算、稀疏矩阵 x 密集向量运算和稀疏矩阵 x 密集矩阵运算。
  • 用于稀疏矩阵 x 稀疏矩阵加法和乘法的例程
  • 用于稀疏密集向量乘法 (SpVV)、稀疏矩阵密集向量乘法 (SpMV) 和稀疏矩阵密集矩阵乘法 (SpMM) 的通用高性能 API
  • ILU0 和 IC0 预处理器

资源