DeepSeek-D1 是由 DeepSeek 团队开发的人工智能模型,以下是关于它的相关信息:
模型特点
-
架构:基于混合专家(MoE)架构,拥有 370 亿活跃参数和 6710 亿总参数。
-
训练方式:采用大规模强化学习(RL)训练。
-
推理能力:擅长复杂问题解决,具备自我验证、多步反思和与人类对齐的推理能力。
-
性能表现:
-
数学能力:在 MATH-500 数据集上准确率达到 97.3%。
-
编程能力:在 Codeforces 竞赛中表现优于 96.3% 的参赛者。
-
通用推理:在 2024 年美国数学邀请赛(AIME)中通过率达到 79.8%,处于全球顶尖水平。
-
应用场景
-
复杂问题解决:能够处理复杂的逻辑推理和数学问题。
-
代码生成:可以生成高质量的代码。
-
多语言理解:支持多语言理解。
部署与使用
-
API 接口:提供与 OpenAI 兼容的 API 端点,每百万 token 的费用为 0.14 美元。
-
开源版本:提供开源的权重和 15 亿至 700 亿参数的精简版本,可用于商业用途。
版本与变体
-
基础版本:R1-Zero。
-
增强版本:R1。
-
精简版本:6 个轻量级精简模型。
开源与社区
-
开源许可:采用 MIT 许可证。
-
社区合作:通过开源社区合作,持续进行多模态支持、对话增强和分布式推理优化等升级。
商业化与定价
DeepSeek-R1 提供多种套餐,包括体验包、团队包、专业包和企业包。