DeepSeek惊艳全球，Nature是如何点评的？

导读

今年春节，科技领域成功出圈的来自杭州的DeepSeek，霸榜热搜、同时震惊全球。

DeepSeek于2023年7月创立，是一家具有强大技术实力和市场竞争力的创新型科技公司，专注于开发先进的大语言模型和相关技术，仅一年多时间成功开发大语言模型。

2025年1月27日，其应用成功登顶苹果美国地区应用商店免费APP下载排行榜，一时间震惊全球，引发各国讨论。

为此，Nature杂志专文探讨中国如何创建人工智能模型DeepSeek并震惊世界。

齐萱 | 编译

整个春节期间，中国科技初创企业DeepSeek凭借两款性能媲美美国科技巨头主导工具的大型语言模型，以极低的成本和计算量，在科技界掀起了一场风暴。

1月20日，这家总部位于杭州的公司发布了DeepSeek-R1，这是一款部分开源的“推理”模型，它解决科学问题的能力与美国旧金山OpenAI公司去年年底推出的最先进的LLM——GPT-4不相上下。

本周早些时候，DeepSeek又推出了另一款名为Janus-Pro-7B的模型，该模型能够根据文本提示生成图像，功能与OpenAI的DALL-E 3和伦敦Stability AI公司开发的Stable Diffusion极为相似。

然而，如此巨大的计算量下，DeepSeek较之OpenAI的所花费的成本却要低上许多。

即使没有DeepSeek，也会有其他的大模型

DeepSeek-R1的表现让全球科技界感到震惊，但中国国内的研究人员表示，这家初创公司的成功在意料之中，符合中国布局人工智能（AI）的雄心壮志。

2017年，中国宣布计划在2030年前使中国成为世界AI领域的领导者，要求该行业在2025年前实现AI技术的重大突破，“使技术和应用达到世界领先水平”。

北京中国科学院计算技术研究所从事AI芯片研究的计算机科学家陈云霁表示，考虑到中国对开发LLM的公司进行了巨额风险投资，以及拥有众多科学、技术、工程和数学领域（包括AI）的博士学位持有者，DeepSeek这样的公司在中国出现是不可避免的，“即使没有DeepSeek，也会有其他中国LLM能做出伟大的事情。”

事实上，确实如此。1月29日，阿里巴巴发布了其迄今为止最先进的LLM——Qwen2.5-Max，阿里巴巴表示，该模型的表现优于DeepSeek去年12月发布的另一款LLM——V3。

上周，Moonshot AI和字节跳动发布了新的推理模型Kimi 1.5和1.5-pro，这两家公司声称，在某些基准测试中，这些模型的表现能超越GPT-4。

中国重视“AI人才”的培养

培养“AI人才”成为中国政府发展AI事业的首要任务。根据华盛顿特区乔治城大学安全与新兴技术中心（CSET）的一份报告，到2022年，中国教育部已批准440所大学开设AI专业本科学位。据伊利诺伊州芝加哥智库MacroPolo称，同年，中国提供了全球近一半的顶尖AI研究人员，而美国仅占18%。

澳大利亚悉尼科技大学专注于中国创新领域的科学政策研究员Marina Zhang表示，DeepSeek可能从政府对AI教育和人才培养的投资中受益匪浅，这些投资包括众多奖学金、研究经费以及学术界与产业界的合作伙伴关系。她补充道，由国家支持的深度学习技术与应用国家工程实验室（由位于北京的科技公司百度牵头）已经培训了数千名AI专家。

关于DeepSeek的员工人数很难找到确切数字，但公司创始人梁文峰在接受中国媒体采访时表示，公司已从中国顶尖大学招聘了毕业生和博士研究生。Marina Zhang表示，公司领导团队中的一些成员年龄不到35岁，他们是在见证中国崛起为科技超级大国的过程中成长起来的。“他们深受创新驱动的自立自强精神的激励。”

事实上，39岁的梁文峰本人也是一位非常年轻的企业家，毕业于浙江大学计算机科学专业。十年前，他与朋友共同创立了对冲基金High-Flyer，并于2023年创立了DeepSeek。

CSET研究中国AI人才的Jacob Feldgoise表示，国家推动建立AI模型开发生态系统的政策，在吸引资金和人才方面，肯定有助于DeepSeek等公司的发展。

但Feldgoise表示，尽管大学开设了越来越多的AI课程，但尚不清楚有多少学生获得了专门的AI学位，以及他们是否掌握了公司所需的技能。他说，近年来，有些中国AI公司抱怨称，“这些项目培养出来的毕业生质量达不到他们的期望”。

DeepSeek的成功不仅是中国AI领域快速发展的缩影，更是中国政府、企业和学术界紧密合作、共同推动技术创新的结果。在有限的资源和约束条件下，中国通过高效的人才培养和科研投入，成功打造出了具有全球竞争力的AI模型，向世界展示了在科技创新方面的实力和潜力。

DeepSeek惊艳全球，Nature是如何点评的？

即使没有DeepSeek，也会有其他的大模型

中国重视“AI人才”的培养

楼主本月热帖推荐: