← 総まとめに戻る

Create / Google I/O 2026

Gemini Omni in Gemini app

Gemini Omniは、テキスト、画像、動画、音声を組み合わせて動画を生成し、会話で編集を積み上げるモデルです。

Gemini Omni in Gemini app の発表内容を整理した生成インフォグラフィック

この発表の要点

Gemini Omniは、テキスト、画像、動画、音声を組み合わせて動画を生成し、会話で編集を積み上げるモデルです。

  • 既存動画を読み込み、背景、スタイル、カメラ、動作を自然言語で変更する。
  • 被写体やシーンの一貫性を保ちながら、複数ターンで編集する。
  • Gemini App、Google Flow、YouTube Shorts/Createに展開される。

機能・発表内容の解説

Gemini Omniは、動画生成を『何もないところから作る』だけでなく、『持っている素材を編集可能な出発点にする』方向へ広げます。公式情報では、物理理解、世界知識、マルチモーダル入力、SynthIDによる透明性も説明されています。

Gemini Omniの重要点は、動画を生成するだけでなく、既存素材を理解して編集できることです。撮った映像や生成済み映像を会話で変えられるなら、制作は『作って終わり』ではなく『素材を育てる』体験に近づきます。

どんなことができるようになりそうか

  • 撮影済みの動画を起点に、背景、質感、演出、スタイルを会話で変えられる。
  • ショート動画、広告素材、説明動画などを、編集ソフトの細かな操作なしに複数パターンへ展開できる。
  • FlowやYouTube Shorts/Createとつながることで、生成と編集を同じ制作フローで扱えるようになりそう。

実用上のポイント

  • 既存動画を読み込み、背景、スタイル、カメラ、動作を自然言語で変更する。
  • 被写体やシーンの一貫性を保ちながら、複数ターンで編集する。
  • Gemini App、Google Flow、YouTube Shorts/Createに展開される。

確認したい点

  • 本人性、権利、AI生成表示の扱いは、実用時に必ず確認すべき領域です。

関連動画