国产GPU能快速部署DeepSeek了
DeepSeek V3、R1系列开源AI大模型开始被各家科技巨头支持、部署DeepSeek,国产硬件也在加速支持。国产全功能GPU摩尔线程快速实现了对DeepSeek蒸馏模型推理服务的高效部署,可让更多开发者基于摩尔线程全功能GPU,进行AI应用创新。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-axegupay5k/922609ff482b437b969755ee4f4c39d3~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1739365649&x-signature=g7P9BJOqb%2FpVBya7TZih5XRrYbc%3D) 此外,用户也可以基于摩尔线程MTT S80、MTT S4000显卡,进行DeepSeek-R1蒸馏模型的推理部署。其实早在1月28日,就已经有B站UP主在摩尔线程MTT S80上手动完成实践。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/d97e3f21af9118c871d4b7c70aace382~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1739365649&x-signature=BMgQigmk0CyPeJ8Fu2kBfXBUGmc%3D) 通过DeepSeek提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产GPU上实现高性能推理。摩尔线程基于自研全功能GPU,通过开源与自研双引擎方案,快速实现了对DeepSeek蒸馏模型的推理服务部署。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/50b3b212f26cfb585b0e0377c99ec86c~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1739365649&x-signature=PCpQKiOm%2F2Jm8KWxeOTCvoND6CQ%3D) 基于Ollama开源框架,摩尔线程完成 DeepSeek-R1-Distill-Qwen-7B蒸馏模型的部署,并在多种中文任务中展现了优异的性能,验证摩尔线程自研全功能GPU的通用性与CUDA兼容性。通过摩尔线程自主研发的高性能推理引擎,结合软硬件协同优化技术,通过定制化的算子加速和内存管理,显著提升了模型的计算效率和资源利用率。
这一引擎不仅支持DeepSeek蒸馏模型的高效运行,还为未来更多大规模模型的部署提供了技术保障。 摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek V3、R1模型,以及新一代蒸馏模型的分布式部署。夸娥集群集成先进推理技术与分布式计算框架,将确保大规模模型的高效稳定运行,助力开发者快速实现业务落地。
|