要聞列表Google 發表 Gemini Omni——一款能「模擬世界」的新一代 AI 影片生成器
Decrypt2026-05-19 18:26:50

Google 發表 Gemini Omni——一款能「模擬世界」的新一代 AI 影片生成器

ORIGINALGoogle Unveils Gemini Omni—A Next-Gen AI Video Builder That Can 'Simulate the World'
AI 影響分析Grok 分析中...
📄完整原文· 由 trafilatura 自動擷取Gemini 翻譯3636 字
簡要摘要 - Google 在 I/O 2026 上推出了 Gemini Omni,這是一款多模態 AI 模型,旨在從幾乎任何輸入內容生成影片及其他媒體。 - DeepMind CEO Demis Hassabis 表示,Gemini Omni 將 Gemini 與包括 Veo、Nano Banana 和 Genie 在內的媒體生成模型相結合。 - Gemini Omni Flash 將首先透過 Google AI 訂閱者的 Flow 和 Flow Music 推出。 Google 於週二推出了 Gemini Omni,這是一款全新的多模態 AI 模型,將該公司的 Gemini AI 模型與包括 Veo、Nano Banana 和 Genie 在內的媒體生成工具相結合。 這項公告是在 Google I/O 2026 期間發布的,DeepMind CEO Demis Hassabis 將 Gemini Omni 描述為「我們能從任何輸入內容創造出任何事物的全新模型」。 「它結合了 Gemini 的智慧與我們最優秀的生成式媒體模型,在世界理解、多模態和編輯方面達到了新的水準,」Hassabis 說道。 Google 表示,首個版本 Gemini Omni Flash 將透過該公司的 AI 電影製作平台 Flow,以及專注於 AI 輔助音樂創作的 Flow Music 推出。 我們推出了 Gemini Omni:這是我們邁向一個能從任何事物創造出任何事物的模型的第一步——從影片開始。 它結合了 Gemini 的智慧與我們的生成式媒體系統——代表了在世界理解、多模態和編輯方面的飛躍 🧵 pic.twitter.com/GAtqzr0VIV — Google DeepMind (@GoogleDeepMind) 2026 年 5 月 19 日 Hassabis 將 Omni 稱為「邁向通用人工智慧(AGI)的一步」,並表示 Google 在過去一年中致力於將 Gemini 擴展為「一個能夠理解並模擬世界的世界模型 AI」。 Google 的 Omni 推出建立在 Nano Banana 的普及基礎上,這是該公司早期的 AI 圖像編輯模型,曾協助 Gemini 在去年 9 月登上 Apple App Store 的榜首。Nano Banana 被廣泛用於迷因生成和對話式圖像編輯,曾短暫協助 Gemini 在應用程式下載量和 Google 搜尋興趣方面,自 OpenAI 的聊天機器人於 2022 年推出以來首次超越 ChatGPT。 在本月初 Decrypt 的比較中,Nano Banana 2 在動漫插畫和空間構圖測試中表現優於 OpenAI 的 GPT Image 2,而 OpenAI 的模型在照片真實感和文字渲染方面表現較佳。Google 現在似乎正透過 Gemini Omni 將許多這些編輯功能擴展到影片領域。 在發表會期間,Google 展示了 Omni 生成一段解釋蛋白質摺疊的黏土動畫風格教育影片。該公司還展示了對話式編輯工具,透過添加新的視覺元素和改變周圍環境來修改自拍影片。 Google 表示,即使在使用者對影片進行更改後,Omni 仍能保持相同的角色、背景和動作一致性——這是許多 AI 影片模型難以做到的。該公司還表示,Omni 利用 Gemini 的推理能力來理解更廣泛的指令,因此使用者無需手動解釋每個細節,即可描述他們想要的場景類型。 該公司還推出了 Flow Agent,這是一款整合在 Google Flow 中的 AI 助理,可以進行場景腦力激盪、組織素材、推薦情節變更以及批次編輯專案。 其他更新包括 Flow Tools,它允許使用者在沒有程式設計經驗的情況下,使用自然語言提示建立自訂的編輯工作流程。 Hassabis 表示,Google 從影片生成開始,但計畫擴大對 Omni 的存取權限,並將其描述為 Gemini 多模態設計背後的長期願景。 「這一直是我們對 Gemini 的目標,也是我們從一開始就將其建構為多模態的原因,」他說。 Google 未立即回應 Decrypt 的置評請求。
資料狀態✓ 已擷取全文閱讀原文(Decrypt)
🔍歷史類似事件· 關鍵字 + 標的比對6 則
💡 目前用關鍵字 + 標的比對(MVP)· 之後會升級為 embedding 語意搜尋
原始資訊
ID:20fe1c4e77
來源:Decrypt
發佈:2026-05-19 18:26:50
分類:一般 · 導出分類 neutral
標的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言