Google, 세계를 '시뮬레이션'할 수 있는 차세대 AI 영상 생성기 Gemini Omni 공개

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯3636 자

요약 - Google은 I/O 2026에서 거의 모든 입력값으로부터 비디오 및 기타 미디어를 생성하도록 설계된 멀티모달 AI 모델인 Gemini Omni를 발표했습니다. - DeepMind CEO Demis Hassabis는 Gemini Omni가 Gemini와 Veo, Nano Banana, Genie를 포함한 미디어 생성 모델을 결합한 것이라고 밝혔습니다. - Gemini Omni Flash는 Google AI 구독자를 위한 Flow 및 Flow Music을 통해 가장 먼저 출시됩니다. Google은 화요일, 회사의 Gemini AI 모델과 Veo, Nano Banana, Genie를 포함한 미디어 생성 도구를 결합한 새로운 멀티모달 AI 모델인 Gemini Omni를 발표했습니다. 이번 발표는 Google I/O 2026에서 이루어졌으며, DeepMind CEO Demis Hassabis는 Gemini Omni를 "어떤 입력값으로든 무엇이든 만들 수 있는 우리의 새로운 모델"이라고 설명했습니다. Hassabis는 "이 모델은 Gemini의 지능과 최고의 생성형 미디어 모델을 결합하여 세계 이해, 멀티모달리티, 편집 수준을 한 단계 끌어올렸습니다"라고 말했습니다. Google은 첫 번째 릴리스인 Gemini Omni Flash가 회사의 AI 영화 제작 플랫폼인 Flow와 AI 보조 음악 제작에 중점을 둔 Flow Music을 통해 출시될 것이라고 밝혔습니다. 우리는 Gemini Omni를 출시합니다: 비디오를 시작으로 무엇이든 무엇이든 만들 수 있는 모델을 향한 우리의 첫걸음입니다. 이 모델은 Gemini의 지능과 우리의 생성형 미디어 시스템을 결합하여 세계 이해, 멀티모달리티, 편집 분야에서 비약적인 발전을 보여줍니다 🧵 pic.twitter.com/GAtqzr0VIV — Google DeepMind (@GoogleDeepMind) 2026년 5월 19일 Omni를 "인공 일반 지능(AGI)을 향한 한 걸음"이라고 부른 Hassabis는 Google이 지난 1년 동안 Gemini를 "세계를 이해하고 시뮬레이션할 수 있는 세계 모델 AI"로 확장하는 데 힘써왔다고 말했습니다. Google의 Omni 출시는 지난 9월 Gemini를 Apple의 App Store 정상에 올리는 데 기여했던 초기 AI 이미지 편집 모델인 Nano Banana의 인기를 기반으로 합니다. Nano Banana는 밈 생성 및 대화형 이미지 편집에 널리 사용되었으며, OpenAI의 챗봇이 2022년 출시된 이후 처음으로 Gemini가 앱 다운로드 및 Google 검색 관심도에서 ChatGPT를 잠시 앞지르는 데 도움을 주었습니다. 이달 초 Decrypt의 비교 테스트에서 Nano Banana 2는 애니메이션 일러스트레이션 및 공간 구성 테스트에서 OpenAI의 GPT Image 2를 능가했으며, OpenAI의 모델은 사실적인 사진 묘사 및 텍스트 렌더링에서 더 나은 성능을 보였습니다. Google은 이제 이러한 편집 기능 중 다수를 Gemini Omni를 통해 비디오로 확장하고 있는 것으로 보입니다. 발표 중에 Google은 Omni가 단백질 접힘을 설명하는 클레이메이션 스타일의 교육용 비디오를 생성하는 모습을 시연했습니다. 또한 회사는 셀카 비디오에 새로운 시각적 요소를 추가하고 주변 환경을 변경하여 수정하는 대화형 편집 도구도 선보였습니다. Google은 Omni가 사용자가 비디오를 변경한 후에도 동일한 캐릭터, 배경, 움직임을 일관되게 유지할 수 있다고 말합니다. 이는 많은 AI 비디오 모델이 어려움을 겪는 부분입니다. 또한 회사는 Omni가 Gemini의 추론 능력을 사용하여 더 광범위한 지시 사항을 이해하므로, 사용자가 모든 세부 사항을 수동으로 설명하지 않고도 원하는 장면의 종류를 설명할 수 있다고 밝혔습니다. 회사는 또한 Google Flow에 통합된 AI 어시스턴트인 Flow Agent를 도입했습니다. 이 어시스턴트는 장면을 브레인스토밍하고, 에셋을 정리하고, 줄거리 변경을 제안하며, 프로젝트를 일괄 편집할 수 있습니다. 추가 업데이트에는 코딩 경험 없이 자연어 프롬프트를 사용하여 사용자 지정 편집 워크플로우를 만들 수 있는 Flow Tools가 포함됩니다. Hassabis는 Google이 비디오 생성부터 시작하지만 Omni에 대한 액세스를 확장할 계획이며, 이를 Gemini의 멀티모달 설계 이면에 있는 장기적인 비전이라고 설명했습니다. 그는 "이것은 항상 Gemini의 목표였으며, 우리가 처음부터 멀티모달로 구축한 이유입니다"라고 말했습니다. Google은 Decrypt의 논평 요청에 즉각 응답하지 않았습니다.

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)

🔍과거 유사 사건· 키워드 + 종목 매칭6 건

2026-05-19

Google, 최강의 멀티모달 영상 모델 'Gemini Omni' 발표! 대화형 심리스 편집 지원, 이번 주 YouTube에 무료 출시

유사도 180%關鍵字 omni/google/gemini

2026-05-22

Google 새롭게 두 가지 AI 네이티브 광고 출시: Gemini로 지난 30년간의 검색 광고 규칙 재정립

유사도 130%關鍵字 google/gemini

2026-05-22

커뮤니티의 비판 이후 Google이 잘못을 인정했다: Antigravity Gemini 속도 제한 3배 상향 및 이번 주 할당량 초기화

유사도 130%關鍵字 google/gemini

2026-05-20