OpenAI推出o3-Pro模型

李孟聊人工智能

于 2025-06-11 23:59:07 发布

阅读量1.3k

点赞数 41

CC 4.0 BY-SA版权

分类专栏：基础模型文章标签： AI编程人工智能大模型 o3-pro OpenAI ChatGPT GPT

本文为博主（李孟）原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/qq_19968255/article/details/148596905

在这里插入图片描述

OpenAI宣布了两个重大更新。首先，o3模型的价格降低了80%。其次，他们发布了一个名为o3-pro的新模型。

o3-pro目前是OpenAI最先进的多模态模型，具有深度推理能力。它逐步解决问题，使其能够在编程、数学、科学、视觉感知等众多领域中更可靠地执行任务。

我知道OpenAI在模型命名方面很糟糕。如果你对o3与GPT-4.x系列或GPT-4o的区别感到困惑，那你并不孤单。以下是一个快速总结，帮助理解这个混乱的情况：

GPT-4.x： 没有高级推理能力的多模态模型。支持文本和图像。
GPT-4o： “o"代表"omni”（全能）。这个模型处理文本、图像和音频。
o3和o3-pro： 具有推理能力的多模态模型。这些是"思考"模型，主要基于文本，对图像支持有限。

这些推理模型可以智能地使用和组合ChatGPT中的每个工具。这包括搜索网络、使用Python分析上传的文件和数据、对视觉输入进行推理，甚至在某些情况下生成图像。

与o3模型相比，o3-pro使用更多计算资源来更努力地思考并提供始终更好的答案。

什么是o3-pro？

要理解o3-pro，你真的必须理解OpenAI的o3模型在幕后做什么，因为o3-pro简单来说就是给o3更多时间和更多计算资源来更努力地思考。

o系列模型是OpenAI专注于推理的产品线。它们与旧的GPT系列的训练方式不同。OpenAI不仅仅在互联网文本上进行预训练，还通过大规模强化学习（RL）来训练o3。其理念是：你可以教会模型不仅仅是重复信息，而是逐步推理解决问题。

作为开发者，有一点真的引起了我的注意。

在o3的开发过程中，OpenAI注意到强化学习显示出与GPT预训练中看到的相同的*“更多计算=更好性能”*缩放规律。换句话说，如果你给模型更多的计算预算并让它推理更长时间，性能会持续提升，甚至超出他们的预期。

他们使用强化学习技术重新追踪缩放路径，在训练和推理中投入了一个数量级更多的计算资源。结果，o3在你让它思考得越多时就变得越聪明。

我认为这是一个关键洞察，因为它解释了为什么o3-pro存在。它不是一个单独的架构。它是o3，但每个请求都运行着更大的计算和推理预算。相同的缩放定律适用——给它更多时间和计算资源，你就能得到更好的答案。

OpenAI甚至验证了在与o1相等的延迟和成本下，o3已经超越了它。但当他们让o3"思考更长时间"时，其性能持续改善。这正是o3-pro设

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

李孟聊人工智能 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。