GPT-5.2が登場、Gemini 3やClaude Opus 4.5と比較してみた

こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事では、OpenAIから新しく公開されたGPT-5.2について触れます。

直近で起こったことやGPT-5.2の特徴、そして他社モデルとの比較結果をまとめます。解説するポイントは次の3つです。

GPT-5.2が公開されたニュースと背景
GPT-5.2の特徴
GPT-5.2・Gemini 3.0・Claude Opus 4.5の比較結果

GPT-5.2が登場した背景

先週、OpenAIからGPT-5.2という新しいモデルが公開されました。OpenAIもGoogleも定期的に新モデルを投入していますが、前回のGPT-5.1の公開からかなり早いペースでの登場です。

背景には、先日OpenAIが発令した緊急事態「Code Red」が関係していると思われます。このところGoogleの勢いがすごく、以前は「GoogleはOpenAIより性能が弱い」という認識が多かったのですが、2024年後半あたりからどんどん追い上げてきました。直近で発表されたGemini 3.0は非常に高性能なモデルです。OpenAIが緊急事態を発令して競争力を高めてきた、という流れです。

OpenAIの発表によると、今回のGPT-5.2はベンチマークでGemini 3.0よりも良い結果を出しているとのことです。このベンチマーク結果だけを切り取ると、現時点で公開されているAIモデルの中でも最も性能の高いモデル、ということになります。

誰が使えるのか

GPT-5.2は全ユーザーが使えます。公開当初は有料ユーザーのみという話でしたが、その後のOpenAIの説明で全ユーザーに展開されることになりました。公式の説明を引用します。

GPT-5.2はChatGPTの全プランでご利用いただけます。無料レベルのアカウントでは、5時間ごとに最大10件のGPT-5.2メッセージを送信できます。この制限に達すると、制限がリセットされるまで、チャットでは自動的にモデルのミニバージョンが使用されます。ChatGPT Plusユーザーは、GPT-5.2を使用して3時間ごとに最大160件のメッセージを送信できます。

無料プランは5時間ごとに最大10件と制限があるので、頻繁に使うとすぐリミットに達すると思います。有料プランは3時間ごとに最大160件なので、通常の使い方なら問題なく利用できます。

GPT-5.2の特徴

GPT-5.2の特徴をまとめると、次のとおりです。

ビジネス業務のタスクに強い
長文の入力にも強い
ハルシネーション（誤った回答）が少なくなっている
2025年8月までの情報を学習している

一般的な業務タスクに強く、よりビジネスのシーンで活躍してくれるモデルです。学習している情報が2025年8月まで伸びている点も特徴です。AIは基本的に最新情報を学習していないので、今日の出来事には答えられません。今はインターネットの情報を参照して回答する機能があるので最新の話題にも対応できますが、参照しなくてもモデル自体が知っている知識が2025年8月までのものになった、ということです。

なお、少し前まで使っていたGPT-5.1は廃止の方向で進んでいくようなので、いずれにせよ今後はGPT-5.2を使っていくことになります。GPT-5.1より性能が良いので、私たちにとってはメリットです。

5つのタスクで比較してみた

GPT-5.2が他社モデルと比べてどうなのか、いくつかのタスクでGPT-5.2・Gemini 3.0・Claude Opus 4.5を比較しました。比較したのは、文章校正、メタプロンプト、ファクトチェック、表（Excel）の作成、スライド生成の5つです。

結論を先に言うと、これらのモデル間で大きな違いはそれほどありませんでした。どのAIもかなり高い精度でタスクをこなしてくれます。とはいえ、細かい点での差はあったので、順番に紹介します。

文章校正

文章の誤りを発見するタスクです。Claudeはもともと文章校正が弱く、今回も一番性能が低い結果でした。ChatGPTとGeminiはどちらも同じスコアで、ChatGPTが見逃した誤字脱字をGeminiが拾い、逆にGeminiが拾った誤字脱字をChatGPTが拾う、という結果でした。

このタイプのタスクは、モデルの併用がおすすめです。同じプロンプトをChatGPTとGeminiに同時に渡し、2つのモデルで誤字脱字を検知すれば、漏れが少なくなります。

メタプロンプト

AIにプロンプトを改善してもらうタスク（メタプロンプト）です。先ほどの文章校正で使ったプロンプトを改善してもらうよう、ChatGPTとGeminiに指示しました。どちらもスコアは改善しましたが、どちらかというとGeminiのほうが結果は良かったです。ただ、以前行った別のプロンプト改善ではChatGPTのほうが良かったので、ここは誤差の範囲だと思います。

ファクトチェック

今回のGPT-5.2のニュース要約に、わざと嘘の情報（誤った公開日など）を紛れ込ませ、AIが見抜けるかどうかをチェックしました。これもさほど違いはありませんでしたが、あえて順位をつけるならGemini、Claude、ChatGPTの順でした。ただ、テクノロジー系のニュースなのか論文に基づく情報なのかで結果は変わると思います。ファクトチェックも文章校正と同じく、複数のAIを併用して漏れを監視するのがおすすめです。

表（Excel）の作成

ChatGPTとClaudeにはExcel、Geminiにはスプレッドシートの作成を依頼しました。余談ですが、GeminiはExcelファイルをそのまま出力できないため、CSVなどで吐き出してExcelに貼り付ける形になります。

「2020年からの日本の人口、GDP、為替レート、日経平均株価を表にまとめてください」という指示で、意図したデータを作ってくれたのはGeminiでした。ただ、Excelとしてそのまま作らせるならChatGPTのほうが使いやすいと感じました。GPT-5.2ではExcelやスライドの作成が強化されているそうなので、ExcelやPowerPointをよく作る人は試してみるとよいと思います。Excelを作りたいならChatGPT、スプレッドシートを作りたいならGemini、という使い分けがよさそうです。

スライド生成

プログラミングに関するトピックを詳しく説明するスライドの作成です。ChatGPTとClaudeはPowerPoint、GeminiはGoogleスライドで依頼しました。今回はあえてデザインに関する指示はせず、自由に作らせています。

見た目も中身のわかりやすさも、Claude、Gemini、ChatGPTの順番でした。スライド作成系のタスクに関しては、Claudeが一番おすすめだと感じました。

比較の総括

以上5つのタスクで比較しました。どのAIを選んでも、仕事を進める上でそんなに不都合はないと思います。モデルの精度に加え、周辺機能も検討材料に入れると、どのAIを使うか決めやすくなります。たとえば、

動画生成のSoraを使いたい → ChatGPTの有料プラン
Gemini Notebook（旧NotebookLM）や画像生成のNano Banana Proをたくさん使いたい → Geminiの有料プラン
AIコーディングツールのClaude Codeを使いたい → Claudeの有料プラン

モデルの性能差は現時点では小さいので、周辺の機能やツールを含めて全体で決めると判断しやすいと思います。

Codex CLIでもGPT-5.2が使える

OpenAIのAIコーディングツール「Codex CLI」でも、GPT-5.2が使えるようになっています。少し試してみましたが、使いやすいですね。私はメインでClaude Codeを使っていますが、Codex CLIも十分に使いやすいと感じました。

補足すると、ChatGPT・Gemini・Claudeにはそれぞれ月額3000円ほどの有料プランがありますが、これに加入すると各社のAIコーディングツールも使えるようになります。ChatGPTならCodex CLI、GeminiならGemini CLI、ClaudeならClaude Codeです。別途契約する必要はありません。これらのツールはファイルの操作や新規作成・変更も行ってくれるので、コーディング以外にスライド作成やドキュメント管理に使っている人もいます。気になる方はぜひ試してみてください。

プロンプトオプティマイザー

最後に、OpenAIのツール「Prompt Optimizer」を紹介します。簡単に言うと、プロンプトを最適化してくれるツールです。今使っているプロンプトを貼り付けてボタンを押すだけで、AIがより良いものに修正してくれます。しかもGPT-5.2向けに最適化してくれる体制が整っています（利用にはAPIの設定が必要です）。

プロンプトを考えるのが面倒なときは、AI自身にプロンプトを作らせたり、こうしたツールで最適化してもらったりするアプローチもおすすめです。

まとめ

最後に、今回のポイントをまとめます。

OpenAIから新しくGPT-5.2がリリースされ、無料ユーザーにも順次展開される
OpenAIのベンチマークによると、GeminiやClaudeを上回っているとのこと
5つのタスクで比較したが、私が試した範囲ではそこまで大きな違いは感じられなかった