DeepSeek「低成本高性能」震撼AI界 Meta組4戰情室應對
中國人工智慧(AI)新創公司DeepSeek(深度求索)以低成本推出高性能AI模型震撼矽谷,臉書母公司Meta的AI研究人員陷入恐慌。據傳Meta生成式AI團隊的主管和工程師已成立四個「戰情室」專門研究DeepSeek的運作方式。
DeepSeek掀起的大模型旋風愈演愈烈,DeepSeek27日在蘋果App Store中國區和美國區免費榜均站上冠軍位置,超越ChatGPT及Meta旗下Threads,以及谷歌Gemini、微軟Copilot等知名應用。然而,DeepSeek受到廣泛關注也引起美國科技巨頭的警覺,勢必會有因應舉措。
科技新聞網站The Information報導,Meta的AI團隊主管近日對DeepSeek推出的新模型公開表達擔憂,擔心Meta在AI競賽中落後。兩名員工透露,包括AI基礎設施總監歐德漢等主管擔心,自家旗艦AI模型Llama的新版本表現可能無法與DeepSeek匹敵。
DeepSeek去年底推出大型語言模型「DeepSeek V3」,根據多份美國公司發表的評估和使用者評價,這款模型在完成多種任務上,符合或甚至超越三大AI公司Meta、OpenAI和Anthropic的模型;該公司接著在本月20日推出另一模型「DeepSeek-R1」,媲美OpenAI的o1推理模型。
應用程式(App)開發商能自由下載DeepSeek,或是透過基於雲端的應用程式介面購買使用權。一些規模較小的App開發商表示,他們已改用DeepSeek,原因是成本低,花費少。
The Information報導指出,OpenAI、Meta和其他頂尖開發商研究人員正仔細分析DeepSeek模型,以尋找可借鏡之處,包括它如何以更低成本、更具效率的方式運作。
Meta已為此籌組四個「戰情室」。一名員工透露,兩個小組聚焦於研究如何降低訓練和運作DeepSeek的成本。雖然Meta的模型是免費的,但是運作成本比OpenAI的模型更高,部分原因是OpenAI能夠透過批次處理消費者數百萬次的查詢來降低價格。
第三個研究小組正在試圖釐清DeepSeek使用了哪些數據來訓練其模型;第四個戰情室則是考慮基於DeepSeek模型歸納出的特質,重新建構Meta的模型。
據稱,Meta正考慮推出一個類似DeepSeek的Llama版本,包含多個AI模型,每個模型專門訓練處理不同任務。
延伸閱讀
贊助廣告
商品推薦
udn討論區
- 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
- 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
- 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
- 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
FB留言