Gemini 2这么一搞PhotoShop就快要不存在了吧
Google还是很有后劲的,就在OpenAI的12天直播被各种调侃没有新东西,碰到瓶颈的时候,Google发布了Gemini 2,这次发布的力度很大,如果说之前在AI Agent Foundry产品底层的模型调用的评测中最后Gemini 1.5占优还有点勉强的话,现在2几乎已经没有争议了。
哦对了,这篇文章不是要说这个的。Gemini有很多进步的,比如今天要说的对图的理解,以前下面这一系列的事情都好麻烦对吧,不过现在也变成了一句话的事儿:比如把一辆小汽车改成敞篷车,或者,把车门打开看看里面:
或者把沙发上的羽绒服P掉,地毯也换掉。又或者下面这个例子:这个纸盒子里装的是什么?拿过来瞅瞅:
这些能力的背后都是工程化的胜利了。不过我也很好奇啊,Gemini 2对Agent的理解怎么还停留在单Agent上,这个图倒是很清晰,但是单Agent还是个消费级的,或者说,Google其实还是要卖云的,所以必须把重负载放到其后端去,所以复杂的场景还是丢出来?
谷歌已经出牌了,好奇微软接下来要干啥。总不能只是端出拿Phi-4这个14B小模型出来跟这个PK吧,虽然Phi-4确实看起来在端侧上有两把刷子,性能已经直逼70B水平的了,但是都是婚宴上你端这个出来总是有点寒碜。
而且Google说不定下一步就拿出Ultra来,微软总不能还指望OpenAI平平无奇的12天对谈就能扭转吧?
|