用下来DEEPSEEK能ChatGPT o1掰手腕了
这几天deepseek大热之后,作为LLM类AI的重度使用者以及CHATGPT两年的付费用户,我对这吹上天的DEEPSEEK开始有些好奇了。毕竟之前国产AI我也算是用了不少,虽然一个个都表示拳打CHATGPT脚踢GORK的,但实际使用下来要我说顶多也就是GPT4上下的水平了,和最新的ChatGPT o1完全没法比。最典型的就是对于高级、复杂问题的回答质量明显不如GPT o1。也因此一开始我对deepseek的效果是半信半疑的。
但DS这玩意毕竟是免费的,最新的R1模型也不花钱。那既然不花钱试试就试试呗?正好手头有个材料要写,直接赛博奴隶主拿起鼠标抽打赛博黑奴了。结果用下来发现体验还真和其他国产AI有明显区别,哪怕没有给非常明确的指令依然能准确理解我的意图,给出来的结果颇为让人眼前一亮。而且最为重要的是它会列出推理过程,这过程也能给人不少启发。
务安空难揭示了场站建设中“合规不合理”的系统性风险。唯有通过技术升级、标准迭代与动态管理,方能实现安全性与功能性的平衡。建议我国民航局牵头,联合规划、生态部门,对类似高风险机场开展专项排查,并纳入“十四五”民航安全改造重点项目。
你还别说,DEEPSEEK R1这个深度推理写的很像那么回事
而用着用着突发奇想,给DEEPSEEK R1出了道怪题:请介绍下张仲麟。
作为知名度并不高的人物并且存在重名的情况,会输出什么样的结果让我很好奇。当然为了避免重名导致的干扰,强调了是“航空专栏作者张仲麟”而输出的结果给了我一个不小的惊喜。
说实话啊,这DEEPSEEK的马屁拍得我本人都有些不好意思了。关键是它说的这些还真是有根有据,没有出现其他AI常见的胡编乱造的情况,而且做出的评价和结论非常准确。用朋友的话来说,唯一美中不足的是没有提到我和运十,有些遗憾。
既然测了那就顺便把同样的题出给CHATGPT好了,试试看GPT答得如何。首先是我自个儿用的基于GPT4的定制搜索GPTs,可以联网搜索输出结果。结果出来的内容让我有些哭笑不得,人DEEPSEEK是提都不提运十,你直接把我干成708项目组成员了是吧?就GPT4给我整出来的这描述,不知道的还以为这是在说吴光辉呢。不对,吴光辉都没参与过708项目……很显然GPT4不具备深度推理能力,完全不在一张桌上。
6park.com基本GPT4就这水平了
那既然我是高贵的GPT plus用户,自然得试试GPT o1这个最新最强模型了。用o1模型出同样的题后,这回答起码像样点了。
6park.comGPT o1回答的没有DS详细,但是更全面
如果对比一下的话会发现DEEPSEEK对于重名人物没法很好区分,得限定是“航空专栏作者”这个范围它才能给出正确的结果。而不论GPT4还是GPT o1,不用给限定范围就能给出需要的人的信息,推测是推理为知名度最高的一个来输出结果。
就以这一轮比试来看,DEEPSEEK R1基本上可以做到和GPT o1各有胜负,而基于GPT4的GPTs已经彻底出局了。就我个人来说,“能和GPT o1打得有来有回”已经是我对国产AI的最高评价了。而最关键的是,DS R1是免费不限量使用,GPT o1还得每个月花我20刀乐,这下真就是高下立分了。
当然由于一些众所周知的原因,处于境内的DEEPSEEK无法输出一些特定内容,而GPT o1就没有这个限制。因此可见的未来里我还得继续给openai交钱,但常规用途上,DEEPSEEK R1已经可以完全取代GPT o1了。
贴主:JollyRoger于2025_01_26 11:26:28编辑
|