DeepSeek惊艳全球,Nature是如何点评的?

送交者: 不知笔名 [☆★★声望品衔11★★☆] 于 2025-02-05 19:07 已读 373 次 大字阅读 繁体阅读

导读

今年春节,科技领域成功出圈的来自杭州的DeepSeek,霸榜热搜、同时震惊全球。

          

DeepSeek于2023年7月创立,是一家具有强大技术实力和市场竞争力的创新型科技公司,专注于开发先进的大语言模型和相关技术,仅一年多时间成功开发大语言模型。

2025年1月27日,其应用成功登顶苹果美国地区应用商店免费APP下载排行榜,一时间震惊全球,引发各国讨论。

              


          

为此,Nature杂志专文探讨中国如何创建人工智能模型DeepSeek并震惊世界。


    

齐  萱 | 编译

          

整个春节期间,中国科技初创企业DeepSeek凭借两款性能媲美美国科技巨头主导工具的大型语言模型,以极低的成本和计算量,在科技界掀起了一场风暴。

          

1月20日,这家总部位于杭州的公司发布了DeepSeek-R1,这是一款部分开源的“推理”模型,它解决科学问题的能力与美国旧金山OpenAI公司去年年底推出的最先进的LLM——GPT-4不相上下。


本周早些时候,DeepSeek又推出了另一款名为Janus-Pro-7B的模型,该模型能够根据文本提示生成图像,功能与OpenAI的DALL-E 3和伦敦Stability AI公司开发的Stable Diffusion极为相似。

          

然而,如此巨大的计算量下,DeepSeek较之OpenAI的所花费的成本却要低上许多。

01

即使没有DeepSeek,也会有其他的大模型

   

DeepSeek-R1的表现让全球科技界感到震惊,但中国国内的研究人员表示,这家初创公司的成功在意料之中,符合中国布局人工智能(AI)的雄心壮志。  

          

2017年,中国宣布计划在2030年前使中国成为世界AI领域的领导者,要求该行业在2025年前实现AI技术的重大突破,“使技术和应用达到世界领先水平”。


          

北京中国科学院计算技术研究所从事AI芯片研究的计算机科学家陈云霁表示,考虑到中国对开发LLM的公司进行了巨额风险投资,以及拥有众多科学、技术、工程和数学领域(包括AI)的博士学位持有者,DeepSeek这样的公司在中国出现是不可避免的,“即使没有DeepSeek,也会有其他中国LLM能做出伟大的事情。”

          

事实上,确实如此。1月29日,阿里巴巴发布了其迄今为止最先进的LLM——Qwen2.5-Max,阿里巴巴表示,该模型的表现优于DeepSeek去年12月发布的另一款LLM——V3。

上周,Moonshot AI和字节跳动发布了新的推理模型Kimi 1.5和1.5-pro,这两家公司声称,在某些基准测试中,这些模型的表现能超越GPT-4。

02

中国重视“AI人才”的培养

 

培养“AI人才”成为中国政府发展AI事业的首要任务。根据华盛顿特区乔治城大学安全与新兴技术中心(CSET)的一份报告,到2022年,中国教育部已批准440所大学开设AI专业本科学位。据伊利诺伊州芝加哥智库MacroPolo称,同年,中国提供了全球近一半的顶尖AI研究人员,而美国仅占18%。

          

澳大利亚悉尼科技大学专注于中国创新领域的科学政策研究员Marina Zhang表示,DeepSeek可能从政府对AI教育和人才培养的投资中受益匪浅,这些投资包括众多奖学金、研究经费以及学术界与产业界的合作伙伴关系。她补充道,由国家支持的深度学习技术与应用国家工程实验室(由位于北京的科技公司百度牵头)已经培训了数千名AI专家。   

          

关于DeepSeek的员工人数很难找到确切数字,但公司创始人梁文峰在接受中国媒体采访时表示,公司已从中国顶尖大学招聘了毕业生和博士研究生。Marina Zhang表示,公司领导团队中的一些成员年龄不到35岁,他们是在见证中国崛起为科技超级大国的过程中成长起来的。“他们深受创新驱动的自立自强精神的激励。”


          

事实上,39岁的梁文峰本人也是一位非常年轻的企业家,毕业于浙江大学计算机科学专业。十年前,他与朋友共同创立了对冲基金High-Flyer,并于2023年创立了DeepSeek。    

CSET研究中国AI人才的Jacob Feldgoise表示,国家推动建立AI模型开发生态系统的政策,在吸引资金和人才方面,肯定有助于DeepSeek等公司的发展。

          

但Feldgoise表示,尽管大学开设了越来越多的AI课程,但尚不清楚有多少学生获得了专门的AI学位,以及他们是否掌握了公司所需的技能。他说,近年来,有些中国AI公司抱怨称,“这些项目培养出来的毕业生质量达不到他们的期望”。   

          

DeepSeek的成功不仅是中国AI领域快速发展的缩影,更是中国政府、企业和学术界紧密合作、共同推动技术创新的结果。在有限的资源和约束条件下,中国通过高效的人才培养和科研投入,成功打造出了具有全球竞争力的AI模型,向世界展示了在科技创新方面的实力和潜力。


喜欢不知笔名朋友的这个帖子的话,👍 请点这里投票,"赞" 助支持!

[举报反馈] [ 不知笔名的个人频道 ] [-->>参与评论回复] [用户前期主贴] [手机扫描浏览分享] [返回学习园地首页]

帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖: (主贴被主有权删除不文明回复,拉黑不受欢迎的用户)

打开微信,扫一扫[Scan QR Code]

进入内容页点击屏幕右上分享按钮

楼主本月热帖推荐:

    >>>查看更多帖主社区动态...