OpenAI推出o3-Pro模型

在这里插入图片描述

OpenAI宣布了两个重大更新。首先,o3模型的价格降低了80%。其次,他们发布了一个名为o3-pro的新模型。

o3-pro目前是OpenAI最先进的多模态模型,具有深度推理能力。它逐步解决问题,使其能够在编程、数学、科学、视觉感知等众多领域中更可靠地执行任务。

我知道OpenAI在模型命名方面很糟糕。如果你对o3与GPT-4.x系列或GPT-4o的区别感到困惑,那你并不孤单。以下是一个快速总结,帮助理解这个混乱的情况:

  • GPT-4.x: 没有高级推理能力的多模态模型。支持文本和图像。

  • GPT-4o: “o"代表"omni”(全能)。这个模型处理文本、图像和音频。

  • o3和o3-pro: 具有推理能力的多模态模型。这些是"思考"模型,主要基于文本,对图像支持有限。

这些推理模型可以智能地使用和组合ChatGPT中的每个工具。这包括搜索网络、使用Python分析上传的文件和数据、对视觉输入进行推理,甚至在某些情况下生成图像。

与o3模型相比,o3-pro使用更多计算资源来更努力地思考并提供始终更好的答案。

什么是o3-pro?

要理解o3-pro,你真的必须理解OpenAI的o3模型在幕后做什么,因为o3-pro简单来说就是给o3更多时间和更多计算资源来更努力地思考。

o系列模型是OpenAI专注于推理的产品线。它们与旧的GPT系列的训练方式不同。OpenAI不仅仅在互联网文本上进行预训练,还通过大规模强化学习(RL)来训练o3。其理念是:你可以教会模型不仅仅是重复信息,而是逐步推理解决问题。

作为开发者,有一点真的引起了我的注意。

在o3的开发过程中,OpenAI注意到强化学习显示出与GPT预训练中看到的相同的*“更多计算=更好性能”*缩放规律。换句话说,如果你给模型更多的计算预算并让它推理更长时间,性能会持续提升,甚至超出他们的预期。

他们使用强化学习技术重新追踪缩放路径,在训练和推理中投入了一个数量级更多的计算资源。结果,o3在你让它思考得越多时就变得越聪明。

我认为这是一个关键洞察,因为它解释了为什么o3-pro存在。它不是一个单独的架构。它是o3,但每个请求都运行着更大的计算和推理预算。相同的缩放定律适用——给它更多时间和计算资源,你就能得到更好的答案。

OpenAI甚至验证了在与o1相等的延迟和成本下,o3已经超越了它。但当他们让o3"思考更长时间"时,其性能持续改善。这正是o3-pro设

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

李孟聊人工智能

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值