Gemini 2.5 Pro (I&O 版)视频秒转 App！网友：比 o3&Claude 强，Vibe 程序员集结！

1- Gemini 2.5 Pro 更新亮点

谷歌 I/O 大会前，Gemini 2.5 Pro 预览版迎来了一波重要升级。

新的 gemini-2.5-pro-preview-05-06 版本已直接替换了之前的 03-25 版本。
本次更新的核心亮点包括：

编码能力重点提升：虽然模型具有广泛的泛化能力，但此次更新特别强化了编码方面的表现。
前端与 UI 开发大放异彩：
- 在构建功能强大、美观的 Web 应用程序的前端和 UI 开发方面表现出色。
- 荣登 WebDev Arena 排行榜第一名，Elo 评分攀升 +147。该排行榜衡量人类对模型构建美观且功能强大的 Web 应用程序的能力的偏好。

AI Studio 视频秒转 App：
- 可以直接在 AI Studio 里，将视频内容转化为可交互的学习 App。
- 观看演示：Gemini 2.5 Pro 如何观看 YouTube 教学视频，解读语义与视觉要素，并输出完整 Web App。

* **VideoMME 基准测试表现优异**：达到 84.8%，意味着它能准确识别代码框架、按钮布局、交互逻辑等细节，并将其组合成一个可运行的学习工具。 * **推理速度提升**：根据体验，新模型在推理速度上较旧版本有显著提升。 **Gemini 2.5 Pro** 让前端开发不再是难事。无需繁琐地翻阅设计稿、对着画布调整参数，只需在 IDE 中一行提示，即可生成视频播放器、表单、布局组件等。

例如，一句 `"add video player"`，风格便能自动契合 **Gemini 95 starter**，CSS、边距、边框等一并搞定。在 **Canvas** 里，通过少量提示即可生成交互式网页。 * **体验地址**：[http://gemini.google.com/model/2-5-pro](http://gemini.google.com/model/2-5-pro) → 选择 "Canvas"

2- 开发者与社区反馈

某初级开发者评估平台 (junior-dev evals): " 更新后的 Gemini 2.5 Pro 在我们的初级开发者评估中表现领先。它是第一个解决了我们一项涉及大型请求路由后端重构评估的模型。感觉更像一个资深开发者…"

Replit Agent 的反馈： " 我们发现 Gemini 2.5 Pro 是在 ’ 能力与延迟比 ’ 方面最好的前沿模型。我期待在 Replit Agent 中推广它，用于那些对延迟敏感且需要高精度完成的任务…"

Google AI Studio 的产品负责人 Logan Kilpatrick 还透露：

提前发布，不等 I/O：团队对新模型非常兴奋，因此提前发布。
Gemini-2.5-Pro-preview-05-06 不仅是顶尖的编码模型，在其他各项任务中也表现出色。

2.1- 性能与价格概览

最优性价比：$2.50 输入 / $15 输出
多项第一：
- MRCR 长文理解：93.0%
- VideoMME 视频理解：84.8%
稳健全能：
- Code Edit：76.5%/72.7%
- Science & Math：83.0%
  与 GPT‑4.1、Claude、Grok、DeepSeek 等模型相比，Gemini 2.5 Pro 实现了 " 价格低、表现高、功能全 "。
  值得注意的是，Gemini 2.5 Pro Preview 05-06 在所有需要长上下文的场景中均优于 OpenAI 的 o3，因其具备 o3 所不擅长的长上下文处理能力。

3- 全网实测

以下是一些用户使用 Gemini 2.5 Pro 进行的实测案例：

自然图像转代码：将自然图像（如叶子）转换为代码以表示独特图案。

> 通过一张叶子图像来编码这太疯狂了。 ![image](https://mmbiz.qpic.cn/mmbiz_gif/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcm7XXQ6lXm54NdA56mjgnVOtndAS4nianzUQO9OCapGf8I9O3zwluFUg/640?wx_fmt=gif&from=appmsg)

生成 " 最好看的太阳系 "：有用户用一个 Prompt 就制作出了太阳系模型，虽有小 bug 但迅速修复。
网友首选编码模型：

有网友表示：“Gemini-2.5-Pro-preview-05-06 现在是我的首选编码模型。它在我的几个硬提示中击败了 o3 和 Claude 3.7 Sonnet。一个示例提示：’ 对来回摇晃的桶中的水进行代码模拟。’ 看看它如何碾压 o3 和 Sonnet。Google，叫它 Gemini 3！”

* **Canvas 应用：芝加哥艺术学院藏品展示**：

* **" 实时人行道模拟 "**：细节丰富，包括实时阴影、程序生成的姓名职业，甚至人物实时心率。

* **视觉效果出色的 SVG 图像**： ![image](https://mmbiz.qpic.cn/mmbiz_png/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcRoVPQaSjqjCX83biciafv8Nmbp2zZibk1YOVdKTuNeWibic6s1guf2NvNZg/640?wx_fmt=png&from=appmsg) * **手绘图生成 App**：

**Gemini 2.5 Pro** 预览版发布后，Vibe 编码器们热情高涨： ![Image](https://mmbiz.qpic.cn/mmbiz_gif/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcnv7TS1BLMpwuMwaXZXMLfibYOTIHiaicGKzatJnxOLfRwhvtfPGChIOibg/640?wx_fmt=gif&from=appmsg) 所以，此刻，Vibe 编码程序员们高呼：" 集结！" ![image](https://mmbiz.qpic.cn/mmbiz_png/Sn1tJhGWmibtKicdkFOjyibhibMreTz7mSbcVZaVOfpyjMnIEGdDyxR5KRPcqu9LwPvHUlkoPdJlJjCkVjhCBuibWwA/640?wx_fmt=png&from=appmsg)

据透露，Visa 公司正在招聘一名氛围编码程序员。
招聘网址：studio/https://www.visa.co.uk/en_gb/jobs/REF061638W

3.1- One More Thing

3.1.1- 模型内部代号揭秘

就在大家还在消化 Gemini 2.5 Pro (I/O 版) 的性能时，社区里已经开始探究模型的内部代号。

有消息称，当前发布的 Gemini 2.5 Pro (包括 05-06 预览版) 内部代号是 “claybrook”。
但有 " 内行 " 用户 (@legit_api 和 @MahawarYas27492) 表示，他们之前测试过的另一个代号为 “Nightwhisper” 的版本，表现 始终优于 “claybrook”。
更强版本雪藏中？ 许多用户开始期待 Google 能在 I/O 大会或其他适当时机，发布这个传说中更强大的 “Nightwhisper” 版本，无论其最终命名是 2.5 Ultra 还是 Gemini Code。

3.1.2- 小调查

最后，做个小投票，您在使用 AI Studio 的时候是否偶尔会出现这种情况：
在 Token 比较长时，接下来无论如何都无法继续对话了。一直报错，但一段时间后又好了。虽然这个 bug 频率并不高。

(Vote: 长对话后报错，无法继续（偶尔）? 是 / 没遇到)

3.1.3- 相关阅读

#技术 #AI #谷歌

#Gemini #AI模型 #编程 #Web开发 #Google #I/O

🚀OCR能力倍增！n8n+Gemini 2.5 pro 0506三分钟打造全自动OCR工作流！保姆级教程搭建企业级OCR识别工作流！高难度扫描件实测Gemini2.5！不懂编程也能搭建自己的自动化工作流上一篇

ai绘画-PUA 4o 生成网页 UI 界面下一篇