こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事では、画像生成AIについて、ChatGPTとGeminiを比較しながら触れます。

画像生成AIにはさまざまな選択肢がありますが、その中でもChatGPTとGeminiはチャット画面から手軽に使えて便利です。今回これを取り上げる理由は、先日GeminiからリリースされたNano Banana Pro(Gemini 3 Pro Imageとも呼ばれるモデル)が非常に精度が良いからです。改めて、ChatGPTとGeminiの画像生成は現時点でどちらが優れているのかを比べてみました。この記事で解説するポイントは次の3つです。

  1. 現時点における主要なAI3社(ChatGPT・Gemini・Claude)の画像生成の現在地
  2. どの画像生成AIが現時点で性能が高いのか
  3. Nano Banana Proを使う上でのテクニック

AI各社の画像生成の現在地

まず、現在のAI各社の状況を整理します。よく使われるのはChatGPT・Gemini・Claudeの3つですが、画像生成のモデルを開発しているのはChatGPTとGeminiの2社です。

一方でClaudeは、画像生成のモデルも動画生成のモデルも開発していません。ここはClaudeならではのスタンスで、ChatGPTやGeminiとは少し異なる方向で開発しているのがわかります。

そのため、AI各社の画像生成を比較すると言っても、実質はChatGPTとGeminiの比較になります。

結論: 現時点ではGeminiが強い

先に結論をお伝えすると、現時点ではGeminiの画像生成のほうが精度が高いです。

画像生成も動画生成も、良い意味でのイタチごっこが続いています。ChatGPTが新しい画像生成を公開すれば、その後にGeminiがもっと良いものを公開し、その次にまたChatGPTが、という具合です。そして現段階では、直近で公開されたGoogleのNano Banana Proが非常に精度が高い状態です。このNano Banana Proは、無料ユーザーも使うことができます。

なお、Geminiの画像生成については、以前のモデル「nano banana」を試した記事もあるので、あわせて読むと進化の度合いがわかりやすいと思います。

何を比較したのか

今回は、人物写真の生成、イラストの生成、複数画像を一つに結合するタスク、画像の修正など、さまざまなタスクで比較しました。

いろいろ試してみて、やはりGeminiのほうが使いやすいと感じるケースが多かったです。AIで作成した画像には「AIっぽさ」が残ることがありますが、そうした不自然さが残らず、より自然な画像を生成できたのはGeminiのNano Banana Proのほうでした。

以前はChatGPTのほうが明確に良いとされるタスクもありました。それが日本語の文字入れです。従来のGeminiの画像生成モデルでは、文字化けのような形になることがほとんどでした。ですが新しいNano Banana Proでは、日本語の文字入れも問題なく行えるようになっています。以前に日本語の文字入れを試して断念した方は、ぜひもう一度試してみてください。かなり精度が上がっていて驚くと思います。私も驚きました。

なぜテキストを正確に画像へ反映できるのかというと、内部でGemini 3 Proのモデルを動作させているからだそうです。これにより、単に綺麗な画像を生成するだけでなく、説明書や手順書のような一枚ものの画像も作れるようになっています。

私はAIのニュースレターを運営していて、以前はその画像にChatGPTのモデルを使っていましたが、今はNano Banana Proに切り替えました。精度が高く、実際に使っていて使いやすいモデルだと感じています。

Nano Banana Proの使い方

Nano Banana Proは、チャット画面から無料ユーザーでも使えます。具体的には、チャット画面でツールから画像作成を選び、モデルをGemini 3 Pro(思考モード)に変更するだけです。

ただ、チャット画面とは別のアプローチもあります。それがAPI経由での利用と、Google AI Studio経由での利用です。Google AI Studioの使い方については別の記事で詳しく解説しています。

チャット画面で使えるのに、わざわざGoogle AI Studioを使う理由は、より精度高く利用できるからです。たとえば4K画像を出力できます。ただし、Google AI Studio経由で使う場合はAPIキーの設定が必要になります。慣れないとハードルが高いですが、これを設定すればGoogle AI Studioから出力したり、プログラムから出力したりできるようになります。

透かしについて

すでにGeminiの画像生成を使ったことがある人はご存知だと思いますが、Geminiで画像を生成すると右下にGeminiのロゴの透かしが入ります。Google AI StudioなどAPI経由で生成した場合は、この右下の透かしは入りません。

ただ誤解のないようにお伝えすると、透かしがないからといって、AIが生成した画像かどうかわからなくなるわけではありません。人間が認知できないレベルで「SynthID」と呼ばれる電子透かしが埋め込まれており、AIが生成したものだと判別できるようになっています。

とはいえ、生成AIで作った画像であることは明示する必要があります。これはルールというよりマナーですが、私も「この画像は生成AIで作りました」としっかり明示するようにしています。この点だけは画像生成を使う上で気をつけたいところです。

SynthIDを判定させてみる

少し余談ですが、Geminiを使えばGeminiで生成した画像を判別できると公式は説明しています。チャット画面で画像をアップロードし、「これはAIで生成されたもの?」「この画像は本物?」と質問すると、SynthIDをチェックして判別してくれる、という内容です。

これは面白いと思って試したのですが、私の環境ではチャット画面ではどうしても機能しませんでした。いろいろ実験した結果、Google AI Studioに画像をアップロードして、次のようなプロンプトを使うと高い精度で判別できるようになりました。

この画像は Google AI によって作成または編集されたものでしょうか?画像にSynth IDが含まれているかチェックして判定してください

ポイントは、プロンプトに「SynthIDが含まれているかチェックして判定してください」という部分を明示的に含めることです。なお、このプロンプトをチャット画面で使っても機能しませんでした。現状はGoogle AI Studio(API経由)でSynthIDをチェックできるようです。気になる方は試してみてください。

APIの価格

Google AI StudioやAPI経由で画像を生成する場合のコストについても触れておきます。ざっくり言うと、1枚あたりだいたい30〜40円ほどです。ドル換算なので為替レートによって変動します。テキスト指示の分量や出力した画像もコストに加算されるため、4K画像を出力したときでだいたい30〜40円くらいと見積もっておけばよいと思います。

商用利用について

Nano Banana Proの商用利用については、Google公式が次のように説明しています。広告利用を含む商業利用の場合は、Google Workspace with Gemini もしくは Vertex AI の利用が案内されています。

またGoogle Cloudの公式ブログでは、次のように説明されています。

商業ニーズへのサポート:nano bananaで生成されるすべてのアセットにSynthIDウォーターマークが組み込まれるため、透明性と責任ある利用を確保できます。一般提供開始時には著作権保護も提供し、お客様の商業ニーズをサポートすることに尽力いたします。

つまり、一般提供が始まる頃には著作権保護も提供するので、安心してビジネスで使ってほしい、という内容です。アパレルやEC系の事業者、広告関連の会社などを想定しているようです。Googleの画像生成に限らず、著作権周りや商用利用の可否については公式の説明が少ない傾向があるので、ビジネスで使う際はこうした案内を確認しておくとよいと思います。

Nano Banana Proのテクニック

最後に、Nano Banana Proを使う上でのテクニックを紹介します。精度の高い画像生成ですが、いくつか欠点もあります。代表的なのが、修正を重ねるほど精度が落ちていくという点です。これはテキストでのAIとのやりとりでもよくある現象で、コンテキストが増えるほど精度が落ちていきます。

修正指示は一括で

対策の一つは、修正指示を一括で行うことです。「このポーズを直してください」「背景を変えてください」と細かく刻むのではなく、「こことこことここを修正してください」とまとめて出したほうがうまく機能することが多いです。

精度が落ちたら新規チャットでリフレッシュ

もう一つは、何度も修正を重ねて精度が落ちてきたと感じたら、新規チャットでリフレッシュすることです。具体的には、まず現時点の最新画像をダウンロードし、新規チャットを立ち上げてその画像をアップロードし、改めて修正を続けます。画像をいったんダウンロードしてアップロードし直す手間はかかりますが、これで作業がやりやすくなります。

来年の展望

2025年も終わりに近いので、おそらく今年中にOpenAIが新しい画像生成を投入してくることはないと思います。ただ来年2026年には、また新しいモデルを投入してくるはずです。そうなれば「OpenAIの新モデルのほうがNano Banana Proより精度が高い」という展開も十分予想されますし、これまで繰り返してきた歴史でもあります。

とはいえ現時点では、ChatGPTとGeminiの画像生成を比較すると、GeminiのNano Banana Proに軍配が上がると感じました。誰でも試せるので、ぜひチェックしてみてください。なおGemini 3本体の比較については別の記事でも触れています。

まとめ

最後に、今回のポイントをまとめます。

  1. ChatGPTとGeminiの画像生成では、現時点ではGeminiのNano Banana Proが精度で上回っていると感じる
  2. Nano Banana Proは無料ユーザーも使える。チャット画面、もしくはAPI経由でGoogle AI Studioから利用できる
  3. API経由はAPIキーの設定が面倒だが、透かしがなくなったり4K画像を出力できたりするメリットがある。場合に応じて使い分けるとよい