一句话点评: 简单解释一下DeepSeek的原理
DeepSeek刚出世的几天确实给美国不小的震动,特别是它如此迅速的研发,和接近OpenAI性能表现。这对于一个连圆珠笔头钢珠都造不好,所有的技术都是引进加山寨欧美技术的国家确实有点逆天。 6park.com事出反常必有妖孽。今天 OpenAI已经声明,DeepSeek非法窃取,引用了它的数据库数据进行训练。这项技术也就是中国所谓的蒸馏技术。 6park.com还有一些粉红说,DeepSeek有自己独特的训练模型,能够高效,不依赖昂贵的硬件就实现ChatGTP的功能和水平。没有数据,训练模型再好也没有用。这里俺也不讲什么复杂的技术原理,因为一般人也听不懂。就用简单的比喻说明一下吧。 6park.com如果把AI比做人,那么一个人的智慧高低就由两方面决定:一是知识,二是思考方式。学习知识就要用到课本,相当于AI的训练数据。中国人学习的方法就是把西方编的教材高度浓缩,而西方的课本比较注重从原始的数据引导学生得出自己的结论。因此表面上看中国学生比西方学生掌握知识的速度快,比较聪明,但实际上并非如此。西方学校比较注重培养学生的思考能力和方式,而在中国学校则训练学生迅速的检索课本上的知识,这些知识多数情况下已经通过背诵存储在脑子里了。因此中国学生能够比西方学生更快更迅速的找到答案。但是对于一些新问题,没有现成答案的问题,中国学生就束手无策了。而西方的学生能够通过学校学习的推理,分析,联想找到课本上找不到的答案。这就叫创造力。 6park.com同理,中国的DeepSeek数据来源就是从OpenAI数据库中提取,经过一个类似于把西方教科书内容浓缩的方法,也就是它自称的训练模型蒸馏产生。如果没有西方的数据,也就是西方学校的课本,中国就是有再好的训练模型也没有用,也编不出来中国的课本,即数据库中的数据。中国的AI模型就像一个寄生虫,它是依附于美国的AI这个宿主上的。 6park.com今天美国OpenAI已经宣布要限制不合理的使用它的数据,这对中国DeepSeek构成严重打击。因为它无法提高智能了,将会永远定格在现在的水平,就和习近平一样,永远是小学生的知识水平了。 6park.com贴主:科普人于2025_01_29 21:36:12编辑版主:赵大夫话室于2025_01_30 0:16:52编辑 评分完成:已经给 科普人 加上 50 银元!
|