このページの本文へ

凄すぎてもはや意味不明!画像生成AIの到達点「Nano Banana Pro」ついに公開

2025年11月21日 06時00分更新

文● G.Raymond 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 Google DeepMindは11月20日、最新の画像生成AIモデル「Nano Banana Pro(Gemini 3 Pro Image)」を発表した。8月26日にリリースされた「Nano Banana(Gemini 2.5 Flash Image)」の上位版にあたり、同社の最新AI基盤モデル「Gemini 3 Pro」の高度な推論能力と現実のデータを組み合わせ、精緻な情報表現ができるようになった。

 なかでも最大の特徴は、文脈を理解したビジュアル生成能力の劇的な向上だ。

 Google検索の膨大な知識ベースと連携できるため、レシピを画像化したり、天気やスポーツの試合結果などリアルタイムの情報を反映したインフォグラフィックを作成したりできるようになった。従来モデルでは苦手とされていた「画像内のテキスト描写」も大幅に改善され、短いキャッチコピーから長文の段落まで、正確かつ読みやすい文字を画像内にレンダリングできる。漢字を含む日本語も、ほぼ破綻なく、様々な書体で反映できることが確認されている。

 クリエイティブ用途、特に漫画などの制作能力も飛躍的に向上した。最大14枚の参照画像を使用し、最大5人の人物の顔立ちや服装といった一貫性を維持したまま、別のアングルやシーンを描かせたりできる。昼から夜へといった照明の変更、カメラアングルの調整に加え、吹き出し内のセリフを含めた複雑なテキスト配置も可能になった。キャラクターと漫画の指定書き、いわゆる“ネーム”を指定して、コマ割り漫画が破綻なく生成できることも報告されている。

 Adobeとのパートナーシップも拡大し、クリエイターはAdobe PhotoshopやAdobe Firefly(ウェブ版)などのツール内で、Nano Banana Proの機能を利用できるようになった。さらに、Google Workspace(Slides、Vids)やGoogle Adsへの統合も順次開始され、ビジネスシーンで利用可能になる。

 使い方は、一般ユーザー(および学生)とプロフェッショナルで異なっている。一般ユーザーは「Gemini」アプリで「Create images」を選択し、「Thinking」モデルを使用することでアクセスできる。ただし無料ユーザーには生成回数に多い制限があり、上限を超えると軽量版のNano Bananaモデルに戻る仕組みだ。X(旧Twitter)では、Nano Banana公式アカウント(@NanoBanana)宛てにプロンプトを送ることで試すこともできる。

 より少ない制限でNano Banana Proを使いたい場合は、Google AI Plus、Pro、Ultraや、Gemini Advancedなどのサブスクリプション契約が必要となる(月額2900円から)。開発者向けにはAPIも公開され、100万トークンあたり約2ドルからの従量課金での利用も開始されている。

 また、AI生成コンテンツの透明性確保についても新たな対策が導入された。生成されたすべての画像には目に見えない電子透かし「SynthID」が埋め込まれており、ユーザーはGeminiアプリに画像をアップロードするだけで、それがGoogleのAIによって生成されたものかを確認できる。さらに、無料およびProユーザーが生成した画像には目に見えるウォーターマーク(キラキラマーク)が入るが、プロフェッショナルな利用を想定したUltra契約者や開発ツールからの出力画像については、ウォーターマークが削除される。

カテゴリートップへ

ピックアップ