Gemini 2.5 Pro (I&O 版)视频秒转 App!网友:比 o3&Claude 强,Vibe 程序员集结!

1- Gemini 2.5 Pro 更新亮点

谷歌 I/O 大会前,Gemini 2.5 Pro 预览版迎来了一波重要升级。

新的 gemini-2.5-pro-preview-05-06 版本已直接替换了之前的 03-25 版本。
本次更新的核心亮点包括:

  • 编码能力重点提升:虽然模型具有广泛的泛化能力,但此次更新特别强化了编码方面的表现。
  • 前端与 UI 开发大放异彩
    • 在构建功能强大、美观的 Web 应用程序的前端和 UI 开发方面表现出色。
    • 荣登 WebDev Arena 排行榜第一名,Elo 评分攀升 +147。该排行榜衡量人类对模型构建美观且功能强大的 Web 应用程序的能力的偏好。

image

  • AI Studio 视频秒转 App
    • 可以直接在 AI Studio 里,将视频内容转化为可交互的学习 App。
    • 观看演示:Gemini 2.5 Pro 如何观看 YouTube 教学视频,解读语义与视觉要素,并输出完整 Web App。
* **VideoMME 基准测试表现优异**:达到 84.8%,意味着它能准确识别代码框架、按钮布局、交互逻辑等细节,并将其组合成一个可运行的学习工具。 * **推理速度提升**:根据体验,新模型在推理速度上较旧版本有显著提升。 **Gemini 2.5 Pro** 让前端开发不再是难事。无需繁琐地翻阅设计稿、对着画布调整参数,只需在 IDE 中一行提示,即可生成视频播放器、表单、布局组件等。
例如,一句 `"add video player"`,风格便能自动契合 **Gemini 95 starter**,CSS、边距、边框等一并搞定。在 **Canvas** 里,通过少量提示即可生成交互式网页。 * **体验地址**:[http://gemini.google.com/model/2-5-pro](http://gemini.google.com/model/2-5-pro) → 选择 "Canvas"

2- 开发者与社区反馈

某初级开发者评估平台 (junior-dev evals): " 更新后的 Gemini 2.5 Pro 在我们的初级开发者评估中表现领先。它是第一个解决了我们一项涉及大型请求路由后端重构评估的模型。感觉更像一个资深开发者…"

image

Replit Agent 的反馈: " 我们发现 Gemini 2.5 Pro 是在 ’ 能力与延迟比 ’ 方面最好的前沿模型。我期待在 Replit Agent 中推广它,用于那些对延迟敏感且需要高精度完成的任务…"

image

Google AI Studio 的产品负责人 Logan Kilpatrick 还透露:

  • 提前发布,不等 I/O:团队对新模型非常兴奋,因此提前发布。
  • Gemini-2.5-Pro-preview-05-06 不仅是顶尖的编码模型,在其他各项任务中也表现出色。

image

2.1- 性能与价格概览

Image

  • 最优性价比:$2.50 输入 / $15 输出
  • 多项第一
    • MRCR 长文理解:93.0%
    • VideoMME 视频理解:84.8%
  • 稳健全能
    • Code Edit:76.5%/72.7%
    • Science & Math:83.0%
      GPT‑4.1ClaudeGrokDeepSeek 等模型相比,Gemini 2.5 Pro 实现了 " 价格低、表现高、功能全 "。
      值得注意的是,Gemini 2.5 Pro Preview 05-06 在所有需要长上下文的场景中均优于 OpenAI 的 o3,因其具备 o3 所不擅长的长上下文处理能力。

3- 全网实测

以下是一些用户使用 Gemini 2.5 Pro 进行的实测案例:

  • 自然图像转代码:将自然图像(如叶子)转换为代码以表示独特图案。
> 通过一张叶子图像来编码这太疯狂了。 ![image](https://mmbiz.qpic.cn/mmbiz_gif/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcm7XXQ6lXm54NdA56mjgnVOtndAS4nianzUQO9OCapGf8I9O3zwluFUg/640?wx_fmt=gif&from=appmsg)
  • 生成 " 最好看的太阳系 ":有用户用一个 Prompt 就制作出了太阳系模型,虽有小 bug 但迅速修复。
    Image

  • 网友首选编码模型

    有网友表示:“Gemini-2.5-Pro-preview-05-06 现在是我的首选编码模型。它在我的几个硬提示中击败了 o3Claude 3.7 Sonnet。一个示例提示:’ 对来回摇晃的桶中的水进行代码模拟。’ 看看它如何碾压 o3 和 Sonnet。Google,叫它 Gemini 3!”

* **Canvas 应用:芝加哥艺术学院藏品展示**:
* **" 实时人行道模拟 "**:细节丰富,包括实时阴影、程序生成的姓名职业,甚至人物实时心率。
* **视觉效果出色的 SVG 图像**: ![image](https://mmbiz.qpic.cn/mmbiz_png/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcRoVPQaSjqjCX83biciafv8Nmbp2zZibk1YOVdKTuNeWibic6s1guf2NvNZg/640?wx_fmt=png&from=appmsg) * **手绘图生成 App**:
**Gemini 2.5 Pro** 预览版发布后,Vibe 编码器们热情高涨: ![Image](https://mmbiz.qpic.cn/mmbiz_gif/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcnv7TS1BLMpwuMwaXZXMLfibYOTIHiaicGKzatJnxOLfRwhvtfPGChIOibg/640?wx_fmt=gif&from=appmsg) 所以,此刻,Vibe 编码程序员们高呼:" 集结!" ![image](https://mmbiz.qpic.cn/mmbiz_png/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcVZaVOfpyjMnIEGdDyxR5KRPcqu9LwPvHUlkoPdJlJjCkVjhCBuibWwA/640?wx_fmt=png&from=appmsg)

据透露,Visa 公司正在招聘一名氛围编码程序员。
招聘网址:studio/https://www.visa.co.uk/en_gb/jobs/REF061638W
image

3.1- One More Thing

3.1.1- 模型内部代号揭秘

就在大家还在消化 Gemini 2.5 Pro (I/O 版) 的性能时,社区里已经开始探究模型的内部代号。
image

有消息称,当前发布的 Gemini 2.5 Pro (包括 05-06 预览版) 内部代号是 “claybrook”
但有 " 内行 " 用户 (@legit_api 和 @MahawarYas27492) 表示,他们之前测试过的另一个代号为 “Nightwhisper” 的版本,表现 始终优于 “claybrook”
更强版本雪藏中? 许多用户开始期待 Google 能在 I/O 大会或其他适当时机,发布这个传说中更强大的 “Nightwhisper” 版本,无论其最终命名是 2.5 Ultra 还是 Gemini Code

3.1.2- 小调查

最后,做个小投票,您在使用 AI Studio 的时候是否偶尔会出现这种情况:
在 Token 比较长时,接下来无论如何都无法继续对话了。一直报错,但一段时间后又好了。虽然这个 bug 频率并不高。

image

(Vote: 长对话后报错,无法继续(偶尔)? 是 / 没遇到)

3.1.3- 相关阅读