ニュース一覧Googleが「世界をシミュレート」できる次世代AI動画生成ツール「Gemini Omni」を発表
Decrypt2026-05-19 18:26:50

Googleが「世界をシミュレート」できる次世代AI動画生成ツール「Gemini Omni」を発表

ORIGINALGoogle Unveils Gemini Omni—A Next-Gen AI Video Builder That Can 'Simulate the World'
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯3636 文字
要約 - GoogleはI/O 2026にて、あらゆる入力から動画やその他のメディアを生成するように設計されたマルチモーダルAIモデル、Gemini Omniを発表した。 - DeepMind CEOのDemis Hassabis氏は、Gemini OmniがGeminiとVeo、Nano Banana、Genieなどのメディア生成モデルを統合したものであると述べた。 - Gemini Omni Flashは、Google AIのサブスクライバー向けにFlowおよびFlow Musicを通じて先行リリースされる。 Googleは火曜日、同社のGemini AIモデルとVeo、Nano Banana、Genieといったメディア生成ツールを組み合わせた新しいマルチモーダルAIモデル、Gemini Omniを発表した。 この発表はGoogle I/O 2026で行われ、DeepMind CEOのDemis Hassabis氏はGemini Omniを「あらゆる入力から何でも作成できる我々の新しいモデル」と説明した。 「これはGeminiの知性と我々の最高の生成メディアモデルを組み合わせたもので、世界理解、マルチモーダル性、編集において新たなレベルに到達している」とHassabis氏は語った。 Googleによると、最初のリリースとなるGemini Omni Flashは、同社のAI映画制作プラットフォームであるFlowと、AI支援による音楽制作に特化したFlow Musicを通じて展開される。 Gemini Omniをリリースします。これは、動画を皮切りに、あらゆるものからあらゆるものを作成できるモデルに向けた我々の第一歩です。 これはGeminiの知性と我々の生成メディアシステムを組み合わせたもので、世界理解、マルチモーダル性、編集における飛躍的な進歩を象徴しています 🧵 pic.twitter.com/GAtqzr0VIV — Google DeepMind (@GoogleDeepMind) 2026年5月19日 Omniを「汎用人工知能(AGI)への一歩」と呼ぶHassabis氏は、Googleが過去1年間、Geminiを「世界を理解しシミュレーションできる世界モデルAI」へと拡張することに注力してきたと述べた。 GoogleによるOmniの展開は、昨年9月にGeminiをAppleのApp Storeのトップへと押し上げる原動力となった同社の初期のAI画像編集モデル、Nano Bananaの人気に基づいている。Nano Bananaはミーム生成や対話型画像編集で広く利用されるようになり、OpenAIのチャットボットが2022年に登場して以来初めて、アプリのダウンロード数とGoogle検索の関心度においてGeminiがChatGPTを一時的に追い抜く一助となった。 今月初めにDecryptが行った比較では、Nano Banana 2はアニメイラストや空間構成のテストでOpenAIのGPT Image 2を上回った一方、OpenAIのモデルは写実性やテキストレンダリングで優れた性能を示した。Googleは現在、それらの編集機能の多くをGemini Omniを通じて動画へと拡張しているようだ。 プレゼンテーションの中で、GoogleはOmniを使用してタンパク質の折り畳みを説明するクレイアニメーション風の教育動画を生成するデモを行った。また、自撮り動画に新しい視覚要素を追加したり、周囲の環境を変更したりする対話型の編集ツールも披露した。 Googleによると、Omniはユーザーが動画に変更を加えた後でも、同じキャラクター、背景、動きの一貫性を維持できるという。これは多くのAI動画モデルが苦戦している点である。また、OmniはGeminiの推論能力を活用してより広範な指示を理解するため、ユーザーはすべての詳細を手動で説明することなく、希望するシーンの種類を記述するだけで済むという。 同社はさらに、Google Flowに統合されたAIアシスタントであるFlow Agentも発表した。これはシーンのブレインストーミング、アセットの整理、プロット変更の提案、プロジェクトの一括編集を行うことができる。 その他のアップデートには、コーディングの経験がなくても自然言語プロンプトを使用してカスタム編集ワークフローを作成できるFlow Toolsが含まれる。 Hassabis氏は、Googleは動画生成から始めているが、Omniへのアクセスを拡大する計画であり、これがGeminiのマルチモーダル設計の背後にある長期的なビジョンであると説明した。 「これがGeminiにおける我々の当初からの目標であり、最初からマルチモーダルになるように構築した理由です」と彼は述べた。 GoogleはDecryptからのコメントの要請に対し、即座には回答しなかった。
データステータス✓ 全文抽出済み原文を読む(Decrypt)
🔍過去の類似イベント· キーワード + 銘柄照合6 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:20fe1c4e77
ソース:Decrypt
公開:2026-05-19 18:26:50
カテゴリ:一般 · エクスポートカテゴリ neutral
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント