“神秘的东方力量”,DeepSeek飙升至美区苹果应用榜第三
截至北京时间1月26日晚22时——仅不到半天的时间内,国产 AI DeepSeek(深度求索)在美区苹果App Store的免费排行榜中,已一路从第六位飙升至第三位,仅次于ChatGPT及Meta公司旗下的社交媒体平台Threads,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
截止北京时间26日晚10时左右,国产AI DeepSeek已升至美区苹果应用榜第三
同在1月26日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。
对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。
近日,DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。
DeepSeek,全称杭州深度求索 人工智能基础技术研究有限公司,成立于2023年7月17日。公司由知名量化资管巨头幻方量化创立,专注于开发先进的大语言模型(LLM)和相关技术。
据介绍,此前DeepSeek在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。
Deepseek(资料图) 金融时报
去年年底,DeepSeek推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)数据显示,DeepSeek-V3在所有模型中排名第七,在开源模型中排第一,是全球前十中性价比最高的模型。
DeepSeek-V3大模型的核心技术创新是其迅速崛起的关键。该模型融合了Multi-head Latent Attention(MLA)、混合专家架构(MoE)和FP8低精度训练三项技术,显著提升了性能与效率。
而在本月20日,DeepSeek又正式开源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena综合榜单上排名第三,与Open AI的顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1拔得头筹;在风格控制以及高难度提示词与风格控制结合的测试中,DeepSeek-R1均与o1 并列第一。
此外,Artificial-Analysis的初始基准测试结果显示,DeepSeek-R1在AI分析质量指数中取得第二高分,但价格却是o1的约三十分之一。
DeepSeek-R1 API价格 图源:DeepSeek 官方资料
DeepSeek以“低成本训练”和“高性价比”为核心卖点,其API输入价格仅为每百万Token 0.1元人民币,远低于Claude 3.5 Sonnet(3美元/百万Token),吸引了不少中小开发者和企业。这种低成本训练策略也让该公司有了“AI界拼多多”的称号,甚至引发了间接冲击英伟达等硬件厂商的讨论。
英伟达高级研究 科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
此外,1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。
这位Meta员工写道:
“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。
工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。
管理层正为Gen AI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?
DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。” 6park.com
|