要闻列表Google发布Gemini Omni——能够"模拟世界"的次世代AI视频生成器
Decrypt2026-05-19 18:26:50

Google发布Gemini Omni——能够"模拟世界"的次世代AI视频生成器

ORIGINALGoogle Unveils Gemini Omni—A Next-Gen AI Video Builder That Can 'Simulate the World'
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯3636 字
简讯 - Google 在 I/O 2026 上推出了 Gemini Omni,这是一款多模态 AI 模型,旨在通过几乎任何输入生成视频及其他媒体内容。 - DeepMind CEO Demis Hassabis 表示,Gemini Omni 将 Gemini 与包括 Veo、Nano Banana 和 Genie 在内的媒体生成模型相结合。 - Gemini Omni Flash 将首先通过 Flow 和 Flow Music 向 Google AI 订阅用户开放。 Google 周二推出了 Gemini Omni,这是一款全新的多模态 AI 模型,将该公司的 Gemini AI 模型与其媒体生成工具(包括 Veo、Nano Banana 和 Genie)相结合。 这一公告是在 Google I/O 2026 大会期间发布的,DeepMind CEO Demis Hassabis 将 Gemini Omni 描述为“我们能够通过任何输入创造任何内容的新模型”。 “它结合了 Gemini 的智能与我们最优秀的生成式媒体模型,在世界理解、多模态和编辑方面达到了新的水平,”Hassabis 说道。 Google 表示,首个版本 Gemini Omni Flash 将通过公司的 AI 电影制作平台 Flow 以及专注于 AI 辅助音乐创作的 Flow Music 发布。 我们正在推出 Gemini Omni:这是我们迈向“从任何事物创造任何事物”模型的第一步——从视频开始。 它结合了 Gemini 的智能与我们的生成式媒体系统——代表了在世界理解、多模态和编辑方面的飞跃 🧵 pic.twitter.com/GAtqzr0VIV — Google DeepMind (@GoogleDeepMind) 2026 年 5 月 19 日 Hassabis 将 Omni 称为“迈向通用人工智能(AGI)的一步”,并表示 Google 在过去一年中一直致力于将 Gemini 扩展为“能够理解并模拟世界的世界模型 AI”。 Google 对 Omni 的推广建立在 Nano Banana 的普及之上,这是该公司早期的 AI 图像编辑模型,曾助力 Gemini 在去年 9 月登顶 Apple App Store。Nano Banana 被广泛用于生成表情包和对话式图像编辑,曾短暂帮助 Gemini 在应用下载量和 Google 搜索热度上首次超越 ChatGPT,这是自 OpenAI 的聊天机器人于 2022 年推出以来的首次。 在 Decrypt 本月初的对比测试中,Nano Banana 2 在动漫插画和空间构图测试中表现优于 OpenAI 的 GPT Image 2,而 OpenAI 的模型在照片级真实感和文本渲染方面表现更好。Google 现在似乎正通过 Gemini Omni 将许多此类编辑功能扩展到视频领域。 在演示过程中,Google 展示了 Omni 生成一段解释蛋白质折叠的粘土动画风格教育视频。该公司还展示了对话式编辑工具,通过添加新的视觉元素和改变周围环境来修改自拍视频。 Google 表示,即使在用户对视频进行更改后,Omni 也能保持角色、背景和动作的一致性——这是许多 AI 视频模型难以做到的。该公司还表示,Omni 利用 Gemini 的推理能力来理解更广泛的指令,因此用户无需手动解释每个细节,即可描述他们想要的场景。 该公司还推出了 Flow Agent,这是一个集成在 Google Flow 中的 AI 助手,可以进行场景头脑风暴、组织素材、推荐情节更改以及批量编辑项目。 其他更新包括 Flow Tools,它允许用户在没有编程经验的情况下,使用自然语言提示创建自定义编辑工作流。 Hassabis 表示,Google 目前从视频生成开始,但计划扩大对 Omni 的访问权限,并将其描述为 Gemini 多模态设计背后的长期愿景。 “这始终是我们开发 Gemini 的目标,也是我们从一开始就将其构建为多模态的原因,”他说。 截至发稿,Google 未立即回应 Decrypt 的置评请求。
数据状态✓ 已抓取全文阅读原文(Decrypt)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:20fe1c4e77
来源:Decrypt
发布:2026-05-19 18:26:50
分类:一般 · 导出分类 neutral
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言