Google「Nano Banana 2」正式提供開始、動画からサムネイル生成も可能に

AI論文
⚠ この記事は AI が生成した下書きをもとに、編集部が確認・編集しています。

Google Cloudは2026年5月29日、画像生成・編集モデル「Nano Banana 2」と「Nano Banana Pro」を一般提供した。Nano Banana 2は「Gemini 3.1 Flash Image」、Nano Banana Proは「Gemini 3 Pro Image」として提供される。 …

引用元: Google、画像生成AI「Nano Banana 2」を正式提供 Gemini APIで利用可能に、動画からサムネイル生成も対応 (Ledge.ai 編集部)

📰 元ネタの内容

Googleが画像生成AI「Nano Banana 2」と「Nano Banana Pro」を2026年5月29日に正式提供開始。Gemini APIで利用可能になり、動画を入力としてサムネイル生成ができるようになった。

Google Cloudは2026年5月29日、画像生成・編集モデル「Nano Banana 2」と「Nano Banana Pro」を一般提供しました。Nano Banana 2は「Gemini 3.1 Flash Image」、Nano Banana Proは「Gemini 3 Pro Image」という名称で提供されます。これらはGoogle CloudのGemini Enterprise Agent Platformで利用でき、開発者向けにはGemini APIからもアクセス可能です。

Nano Banana 2は「gemini-3.1-flash-image」として提供される画像生成モデルで、Gemini 3 Pro Imageの高効率版と位置づけられています。速度と大量利用、コストとレイテンシのバランスを重視する用途に向いており、広告やSNS向けのビジュアル制作、商品画像の編集、ストーリーボード、教育用イラスト、インフォグラフィックなど、幅広い画像生成・編集ワークフローでの利用が想定されています。生成画像にはGoogleの電子透かし技術「SynthID」が含まれます。

今回の発表では、Nano Banana 2に動画を入力プロンプトとして使う機能が追加されました。テキストやPDF、画像に加え、動画ファイルを入力として渡すことで、動画の文脈や被写体、動作を分析し、サムネイルやインフォグラフィックなどの画像を生成できます。動画ファイルの直接アップロード、または公開YouTube URLをテキストプロンプトとともにマルチモーダル文脈として渡すことが可能です。用途としては、高品質なサムネイル、映画ポスター、要約インフォグラフィックなどが挙げられています。ただし、この機能は動画そのものを生成するのではなく、動画を入力として扱い、その内容をもとに静止画像を生成する機能です。また、動画入力はPreview機能として位置づけられています。

画像の出力解像度については、1Kと2Kが両モデルで正式提供されます。4K出力は引き続きPreview扱いです。正式版の公開にともない、Preview版の「gemini-3.1-flash-image-preview」と「gemini-3-pro-image-preview」は非推奨となりました。Googleは2026年6月25日にこれらのPreview版を停止する予定としており、開発者は既存のアプリケーションやワークフローで使用しているPreview版を、正式版のモデルID(Nano Banana 2は「gemini-3.1-flash-image」、Nano Banana Proは「gemini-3-pro-image」)へ移行する必要があります。

💭 アイちゃんの見解

このニュースの本質と新規性

このニュースの核心は、Googleが画像生成AIの「実用化フェーズ」をさらに進めたということだと感じます。Nano Banana 2が正式提供されたことで、これまでPreview(試験版)だったものが安定版として企業や開発者に信頼できる形で提供されるようになりました。新しい点は、動画を入力として受け付けられるようになったことです。これまでは「テキスト→画像」「画像→編集」といった単一のパイプラインでしたが、動画という複雑な情報源からサムネイルやポスターを自動生成できるのは、コンテンツ制作の効率化という観点で大きな変化です。ただし、あくまで動画生成ではなく「動画の内容から静止画を作る」という限定的な機能である点は重要で、期待値の調整が必要かもしれません。

既存技術・既存サービスとの比較

画像生成AIそのものは既に多くの企業が提供しています。OpenAIのDALL-E、Midjourney、Stable Diffusionなどが有名ですが、Nano Banana 2の差別化ポイントは「速度とコストのバランス」にあると言えます。「高効率版」という位置づけは、大量の画像を短時間に生成する必要があるSNS運用や広告制作といった実務向けです。一方、Nano Banana Proは高品質版として機能分化されています。既存サービスとの大きな違いは、Googleが「Gemini Enterprise Agent Platform」という企業向けプラットフォームに統合した点で、エンタープライズ顧客にとっては他のGoogle AI機能との連携がシームレスになる利点があります。動画入力機能も、他の大手サービスではまだ一般提供レベルではない機能と言えるでしょう。

読者の生活・仕事への影響

もし皆さんが動画コンテンツを扱う仕事をしていれば、かなり直接的な影響があります。YouTubeクリエイターなら、動画から自動でサムネイルを生成できるようになれば、制作時間を大幅に短縮できます。ECサイト運営者なら、商品の紹介動画から複数のバリエーション画像を一気に生成して、異なるプラットフォーム用に最適化できるかもしれません。広告代理店なら、クライアントの動画素材から複数のポスター案を短時間で提案できるようになります。一般的なユーザーにとっても、これらの効率化が進めば、より多くの企業がAIを活用した高品質なビジュアルコンテンツを提供できるようになり、結果として目にするコンテンツの質が向上する可能性があります。ただし、SynthIDという電子透かしが付く点は、AI生成画像であることが追跡可能になるという意味で、信頼性向上と透明性確保の両面を意味します。

業界全体への示唆と今後の展開

このニュースが示唆するのは、AI企業各社が「基礎研究から実装へ」という段階へシフトしているということです。Preview版の廃止予定(2026年6月25日)というタイムラインから見ると、Googleは急速に正式版へ移行させたいという意思が伝わってきます。これは、競争が激しくなっているからこそ、安定版をいち早く市場に提供して顧客を囲い込みたいという戦略かもしれません。業界全体への影響としては、画像生成AIの「品質」から「実用性と速度」へ評価軸がシフトしていることが見て取れます。また、動画入力機能のPreview提供は、今後のマルチモーダルAIの進化方向を示唆しており、1年以内には他社も同様の機能を追い始める可能性が高いと予想します。一方で、4K出力がまだPreview扱いという点から、超高解像度生成にはまだ技術的課題があることも窺えます。3ヶ月後には、他のAI企業がこれに対抗する発表をしているでしょうし、1年後には動画からの画像生成がスタンダード機能になっているのではないでしょうか。

関連ツール

  • ConoHa VPS — 個人開発に最適な国産VPS、月額¥296〜
  • ConoHa AI Canvas — ブラウザで使えるAI画像生成サービス

コメント

タイトルとURLをコピーしました