Gemini 3が登場、GPT-5.1やClaude Sonnet 4.5と比較してみた

こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事では、GoogleがリリースしたGemini 3を、ChatGPTやClaudeと比較しながら紹介します。

普段ChatGPTを使っている人もいれば、Gemini派、Claude派という人もいると思います。今回はGemini 3の登場を機に、改めて現在のAI各社のモデルを比較してみました。この記事で解説するポイントは次の3つです。

Gemini 3が公開されたニュース
Gemini 3の海外を中心とした評価
実際にGemini・ChatGPT・Claudeで比較した感想

Gemini 3が登場

先週、Googleから新しいモデル「Gemini 3」が発表されました。年内に公開すると言われていたので、予定通りのリリースです。一つ前のモデルがGemini 2.5でしたが、バージョンが3になりました。

各社のモデルリリースの流れを振り返ると、まずAnthropicがClaude Sonnet 4.5を発表し、続いてOpenAIがGPT-5.1を発表、そして最後にGoogleがGemini 3を発表した、という順番です。

なお、Claudeについては、この比較を行ったあとにさらに新しいClaude Opus 4.5が発表されています。厳密にはそちらが最新ですが、この記事ではClaude Sonnet 4.5・GPT-5.1・Gemini 3の3つで比較を行っています。

Googleの公式サイトでは、Gemini 3について次のように説明しています。

Gemini 3 は、推論能力において最先端のモデルです。創造的なアイデアにある小さな手がかりも察知し、または困難な問題が複雑に絡み合った要素を解きほぐすといった、深みとニュアンスを理解するよう設計されています。さらに、Gemini 3 はユーザーのリクエストの背景にある文脈と意図を把握する能力が飛躍的に向上したため、短いプロンプトでも必要な結果を得ることができます。

公式の発表内容はGoogleのブログ記事にまとまっています。

誰が使えるのか

この最新モデルは、ありがたいことに誰でも使えます。有料ユーザーはもちろん、無料ユーザーも利用可能です。Geminiのサイトにアクセスすれば、すぐに試せます。

海外を中心とした評価

Gemini 3は、さっそく海外の掲示板でも話題になっています。さまざまなユーザーが試した感想を投稿し合っているのですが、評価が二極化しているのが興味深い点です。

どういうことかというと、Geminiに依頼する人の属性によって評価が分かれているのです。コーディングや研究などのタスクで使っている人は「Gemini 3、大幅に性能が向上した」と高く評価する声が多い一方で、日常会話や日常タスクに使っている人は「期待していたほどではなかった」「肩透かしをくらった」という評価が多く見られました。

補足として、AIモデルの比較サイト「LMArena」の結果も紹介すると、テキスト生成・Web開発・画像認識のいずれのタスクでも、Gemini 3 > ChatGPT（GPT-5.1）> Claude Sonnet 4.5 という順番でした。

この結果だけ聞くとGemini 3が圧倒的なように感じますが、実際はタスクによって変わるのではないかと思います。テキスト生成と一口に言っても、小説の作成、営業メールの下書き、文章校正、アイデアの壁打ちなど、中身はさまざまです。

最近感じているのは、確かにモデルの得手不得手は存在するものの、もともとのモデルの性能が高くなってきているので「このモデルは全然使えない」ということがなくなってきている、という点です。今はGemini 3がいいねという話になっても、次はClaudeやChatGPTが新しいモデルを投入してきます。良い意味でのイタチごっこです。

そして最近の傾向として、1つのAIモデルだけを使うのではなく、複数のAIモデルを併用するのが一番いい、という意見が増えてきたように感じます。私もこの併用には大賛成で、文章校正やプログラムを書くときなどは複数モデルに出力させて、良い結果を採用するようにしています。イメージとしては会議に近く、2人より3人、4人で議論したほうが、違った意見が出たり、誰かが他の意見の誤りを訂正してくれたりすることがあります。あらゆるタスクで複数使いをすると逆に効率が悪くなりますが、ここぞというタスクでは複数使いがおすすめです。

6つのタスクで比較してみた

今回も、いくつかのタスクでAIモデルの比較を行いました。具体的には次の6つです。環境はGemini・ChatGPT・Claudeいずれも有料プランで揃えています。

情報抽出
Webページの要約
YouTubeの要約
文章の作成
文章の校正
メタプロンプト

情報抽出

まずは情報抽出のタスクです。ある企業のレポート（約50ページのPDF）から、記載されている人物名をすべて抽出するという内容です。

結論から言うと、Geminiが一番精度が高く、Gemini > ChatGPT > Claude の順番でした。

Claudeはファイルサイズのエラーで読み込めず、タスク自体をスタートできませんでした。ChatGPTは精度こそ悪くなかったものの、時間がかかり過ぎるのが難点でした。標準の思考モードで約6分、じっくり思考するモードでは約14分かかっています。

一方のGeminiは、このタスクをわずか45秒で完了しました。しかも回答結果はChatGPTと同程度、なんならGeminiのほうが若干良かったほどです。ファイルをアップロードするまでの時間も、全AIの中で最も速かったです。回答の精度だけでなく、この速度の違いも見逃せないポイントだと思います。

Webページの要約

次に、特定のURLを渡して内容を要約してもらうタスクです。これはどのモデルも精度が良く、甲乙つけがたい結果でした。約2000文字程度のWebページであれば、どれも変わらないという印象です。

YouTubeの要約

特定のYouTube URLを渡して、タイムスタンプ付きの要約を依頼しました。動画を要約し、その内容が動画のどこで話されているかも一緒に示してもらう、という内容です。

結論を言うと、Gemini > ChatGPT > Claude というより、Gemini以外はまともに機能しませんでした。ClaudeはYouTubeの要約はできないという回答、ChatGPTもYouTubeは要約できないため他のWeb情報を参照して要約します、という対応でした。つまりYouTubeの要約と見せかけて、別のWebページから情報を引っ張ってくるわけです。

ここはGoogleならではでしょう。YouTubeはGoogleが展開するサービスなので、YouTubeの要約や処理に関してはGemini一択だと思います。

文章の作成

次は営業メールの作成です。これは主観的な判断になりますが、どのAIも精度高く文面を作成してくれました。以前は「文章作成はClaude」という評価が多かったのですが、日本語の営業メール作成に限れば、Claudeだけが突出して高いという感じもなくなってきている気がします。

文章の校正

一方で文章の校正になると、結果が少し変わってきます。Gemini > ChatGPT > Claude の順番でした。

やはりClaudeは他のモデルに比べて文章校正は弱いですね。少し前まではChatGPTがやや上、Geminiがその下という印象でしたが、今回から評価が変わりました。ChatGPTはシンプルに回答速度が遅く、対象テキストが多いほどその差が顕著になります。Geminiはとにかく速く、精度もChatGPTと同程度、やや上と感じることが多かったです。

メタプロンプト

最後はメタプロンプト、つまりAI自身にプロンプトを作成・改善させるタスクの比較です。元のプロンプトに対して最小限の変更を行うパターンと、大幅な変更を行うパターンの両方を試しました。使ったのはOpenAIが公開しているメタプロンプトで、おおよそ次のような内容です。

プロンプトの最適化を依頼された際は、あなた自身の視点から回答してください。具体的には、望ましい挙動をより確実に引き出し、望ましくない挙動を防ぐために、どの特定のフレーズを追加または削除すべきか説明してください。元のプロンプトを可能な限り維持しつつ、これらの課題を一貫して改善するために、どのような最小限の編集や追加を行いますか？

結果は、AIモデル間でそれほど差はないという印象でした。あえて言えば、最小限の変更ならややGemini、大幅な変更ならChatGPTが良いと感じました。ただ今回試したのは日常タスク向けのプロンプト改善です。AIエージェント向けやコーディングタスク向けのプロンプトでは、また結果が変わってくると思います。

比較の総括

以上6つのタスクで比較を行いました。回答精度に関しては、それほど大きな差はないというのが正直な感想です。

ただ、回答精度以外の部分、つまり回答速度や容量の大きなファイルを扱えるかという観点では、Geminiに軍配が上がると思います。これはあくまで普段使っているチャット画面からの操作での話で、Claude CodeやGemini CLI、Codexのようなコーディング系ツールで試すと、また違った結果になると思います。

なおモデルの比較全般については、以前Claude 4とChatGPT・Geminiを比較した記事でも触れているので、あわせて参考にしてみてください。

あわせて発表されたGoogleのニュース

Gemini 3と同じタイミングで、Google関連のニュースがいくつも発表されました。簡単に紹介します。

まず、Gemini Notebook（旧NotebookLM）にスライド生成機能が追加されました。Gemini Notebookは、ユーザーがアップロードしたソースをもとに、ポッドキャストやレポート、動画などを生成できるGoogleの情報整理ツールです。今回、新しくスライドとインフォグラフィックを生成できるようになりました。やや内容が冗長なページもありますが、無料プランでも試せます。

また、従来の画像生成モデル「nano banana」の上位版であるNano Banana Proも発表されました。こちらも無料ユーザーが使えます（生成枚数には制限あり）。ツールで画像作成を選び、モデルを高速モードから思考モード（Gemini 3 Pro）に変更するだけで利用できます。特に日本語の文字入れが大幅に強化されたと話題になっています。

さらに、AIコードエディター「Antigravity」も発表されました。Gemini 3本体、Gemini Notebookの新機能、新しい画像生成モデル、新しいコードエディターと、まさにGoogle祭りといった様相です。最近のGoogleの勢いには目を見張るものがあります。

まとめ

最後に、今回のポイントをまとめます。

新しくGemini 3が公開され、無料ユーザーも利用できる
海外の評価は二極化しており、日常タスクでは「あまり変わらない」、コーディングや研究では「性能が上がった」という声が目立つ
Gemini・ChatGPT・Claudeを比較したところ、回答精度に大きな差は感じなかったが、回答速度や処理容量はGeminiが強い

モデルの性能はどこも高い水準に達しているので、これからは1つに固執せず、タスクに応じて複数のAIを使い分けていくのがおすすめです。