Gemini 2这么一搞PhotoShop就快要不存在了吧 -6parkbbs.com

Gemini 2这么一搞PhotoShop就快要不存在了吧

送交者: 雪狼99[☆★★★声望勋衔15★★★☆] 于 2024-12-16 18:36 已读 8450 次

雪狼99的个人频道

Google还是很有后劲的，就在OpenAI的12天直播被各种调侃没有新东西，碰到瓶颈的时候，Google发布了Gemini 2，这次发布的力度很大，如果说之前在AI Agent Foundry产品底层的模型调用的评测中最后Gemini 1.5占优还有点勉强的话，现在2几乎已经没有争议了。

哦对了，这篇文章不是要说这个的。Gemini有很多进步的，比如今天要说的对图的理解，以前下面这一系列的事情都好麻烦对吧，不过现在也变成了一句话的事儿：比如把一辆小汽车改成敞篷车，或者，把车门打开看看里面：

或者把沙发上的羽绒服P掉，地毯也换掉。又或者下面这个例子：这个纸盒子里装的是什么？拿过来瞅瞅：

这些能力的背后都是工程化的胜利了。不过我也很好奇啊，Gemini 2对Agent的理解怎么还停留在单Agent上，这个图倒是很清晰，但是单Agent还是个消费级的，或者说，Google其实还是要卖云的，所以必须把重负载放到其后端去，所以复杂的场景还是丢出来？

谷歌已经出牌了，好奇微软接下来要干啥。总不能只是端出拿Phi-4这个14B小模型出来跟这个PK吧，虽然Phi-4确实看起来在端侧上有两把刷子，性能已经直逼70B水平的了，但是都是婚宴上你端这个出来总是有点寒碜。

而且Google说不定下一步就拿出Ultra来，微软总不能还指望OpenAI平平无奇的12天对谈就能扭转吧？

喜欢雪狼99朋友的这个贴子的话，

帖子内容是网友自行贴上分享，如果您认为其中内容违规或者侵犯了您的权益，请与我们联系，我们核实后会第一时间删除。

所有跟帖: ( 主贴楼主有权删除不文明回复，拉黑不受欢迎的用户 )

打开微信，扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐：