DeepSeek 可能带来多元语言的结合建模
DeepSeek 可能带来多元语言的结合建模
多元语言的结合建模这个概念,是我的原创首发。
起因于第一次在著名德文杂志《商业周刊》(Wirtschaftswoche)里看到 “ 向中国学习” 这句话,因为 DeepSeek刺激了欧洲重返AI竞赛。
目前欧盟还没有一家公司像美国著名公司那样在人工智能技术上领先,因为在比较人工智能模型能力的众多性能排名中,到目前为止排名靠前的OpenAI、Anthropic、Google、Meta等都是来自美国的公司。不过,DeepSeek R1 模型因为率先开源和使用更便宜,最近经常出现在顶部。
我个人觉得造成欧盟在AI竞赛中过去被超越的原因很多,比如 :
第一,欧洲审计院去年就在一份报告中警告称:“在人工智能投资方面,欧盟无法跟上世界领先企业的步伐。” 比如在2023年,德国公司在人工智能技术上的投资总额为19 亿美元,而美国公司为 670 亿美元。第二,美国的主流通用官方语言是英语,中国的主流通用官方语言是汉语,而欧盟的通用官方语言是德语,法语,西班牙语,意大利雨,,,,第三,100 多位位科学家工程师为开发 Deepseek 做出贡献,而在欧盟这样强大的团队不多 。
Deepseek 证明了,通过算法的改进,也可以低成本的训练出人工智能模型。所以,今后在人工智能投资方面,欧盟没有困难。而且欧洲的语言多元化,很可能促进人工智能模型的多样化。
如果多元语言结合建模,有可能产生更有效的 人工智能模型。比如可以对比下面的一句汉语和德语翻译,简单举例说明一下。
我看到在闪电的光明中一只怪声吼叫的猿猴消失在哀牢山的原始森林中。Ich sah einen Affen mit einem seltsamen Gebrüll im Licht des Blitzes im Urwald des Ailao-Berges verschwinden.
我们都会立即发现汉语的四方形状有助于减小占据版面。同时,德语的人工智能模型只需要读了4个token,就知道了这句话的大意是 "Ich sah einen Affen " (我看到一只猿猴)。而在上文那句汉语中,汉语编程的人工智能模型需要读了18个token,才知道这句话的大意是 "我看到一只猿猴 " (Ich sah einen Affen)
我心中的多元语言结合建模,就是把所有语种中有助于建立节能快速的人工智能模型的元素结合起来,技术上没有问题。
当然,目前不存在汉语和德语结合建模的可能性。但是在欧盟,如果各成员国愿意走向文化的融合,就存在着多元语言结合建模的可能性,也許重大的人工智能創新在歐洲也有可能實現。DeepSeek 可能带来多元语言的结合建模
贴主:桂花酒于2025_02_05 16:25:48编辑
已标注为桂花酒的原创内容,若需转载授权请联系网友本人。若违规侵权,请联系我们
所有跟帖: ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )
楼主前期社区热帖:
>>>>查看更多楼主社区动态...