こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事では、GPT-5の特性を理解して、プロンプトを改善するアプローチについて触れます。
GPT-5が公開されてしばらく経ちましたが、「前のモデルより精度が上がった」という人もいれば、「前のモデルのほうが良かった」という人もいるようです。実は、GPT-5の精度が低いと感じる理由には、GPT-5の特性が関係している可能性があります。
この記事では、GPT-5の特性を押さえたうえで、回答精度を上げるプロンプトのテクニックを一緒に学んでいきます。話すポイントは次の3つです。
- GPT-5の特性について
- GPT-5の回答精度を上げるプロンプトテクニック
- プロンプトの改善をAIに任せるメタプロンプティング
なお、GPT-5そのものの概要や他モデルとの比較はGPT-5・Claude Opus 4.1・gpt-ossを比較で詳しく触れているので、あわせてどうぞ。
GPT-5の特性
GPT-5は様々な面で以前のモデルよりアップグレードしています。OpenAIの説明によると、GPT-5は開発者を念頭にトレーニングされたモデルで、外部ツールの呼び出し、指示の追従、コンテキスト理解の向上に重点が置かれています。
この説明の中に、GPT-5の重要な特性が含まれています。それが「指示の追従」です。つまり、GPT-5は人間の指示(プロンプト)に忠実に従うように設計されています。
これはGPT-4.1にも見られた特徴です。指示に正確に従うというのは、一見すると非常に良い特性に聞こえますよね。ただ一方で、この特性は、矛盾した指示や曖昧な指示に対してはパフォーマンスを発揮しにくいことも意味しています。
私はGPT-4.1を初めて使ったとき、融通が効かないモデルだなと感じました。ふわっとした指示では思うように動いてくれない、という感覚です。それと同じことがGPT-5でも起きているように感じます。これまでGPT-4oを使ってきた人からすると、いきなりGPT-5に変わって「回答精度が落ちた」「融通が効かなくなった」と感じるケースは少なくないと思います。
どうすればいいのか
ではどうするかというと、改めてプロンプトのアプローチを見直すことです。OpenAIはGPT-5向けのプロンプティングガイドも公開しています。ここからは、このガイドの内容にも触れながら、プロンプト改善のアプローチを紹介していきます。
第一歩は、明確な指示を書く、曖昧な指示をしないということ。これはGPT-5に限らずどのモデルにも言えることですが、指示に忠実に従うGPT-5では特に効果が大きいです。しっかり指示を書くことが前提になります。
そのうえで、もう一つ有用な考え方があります。それは、AI自身に考えさせるというアプローチです。具体的には、AIにタスクの計画を立てさせたり、自己評価をさせたり、プロンプト自体を改善させたりします。順番に見ていきましょう。
テクニック1: AIに計画を立てさせる
1つ目は、AI自身にタスクの計画を立てさせるアプローチです。
簡単なタスクでは必要ありませんが、少し複雑なタスクになると、いきなり実行させるのではなく、先にAIに計画を立てさせてから実行させると回答精度が上がります。具体的には、プロンプトに次のような一文を加えます。
まず計画を立てて、それに従って実行して
このように計画立案から実行に移るアプローチは、GPT-5を効果的に制御する方法としてプロンプティングガイドでも推奨されています。実はこれ、論文でも紹介されている「Plan and Solve Prompting」というプロンプトエンジニアリングのテクニックでもあります。
Plan and Solveでは、まずプランの段階でタスク全体を俯瞰し、それを遂行するためのステップをサブタスクに分解して詳細な計画を立てます。次にソルブの段階で、立てた計画に従って各サブタスクを一つずつ実行します。
私自身の経験では、GPT-5の非推論モードで文章校正を実行するとスコアが悪いという現象に遭遇しました。そこでこのPlan and Solveを加えたところ、スコアが大幅に改善しました。複雑なタスクを処理するときは、ぜひ試してみてください。
テクニック2: AIに自己評価をさせる
2つ目は、AIに自己評価をさせるアプローチです。これはセルフリフレクション(自己評価)と呼ばれ、たびたび紹介されるプロンプトテクニックです。
たとえば新しくアプリを作るとします。このとき、いきなり作らせるのではなく、「良いアプリとは何か」という基準そのものをAIに考えさせます。つまり、完璧な成果物の基準を定義させてから実行に移るわけです。タスクのゴールを「タスクの完了」から「最高品質の成果物を作ること」へと引き上げるのが狙いです。
たとえば、こんなプロンプトにします。
このタスクにおける完璧な成果物の基準を7項目、内部的に設定してください。その基準をすべて満たすまで自己評価と修正を繰り返してから、最終的な成果物のみを回答してください。
これはアプリ制作に限らず、会議資料、顧客への提案書、戦略立案など、さまざまなタスクに応用できます。AI自身に最高の成果物を定義させ、その基準を満たすまで自己評価と修正を繰り返させる。イメージとしては、AIを品質の管理者にまで拡張するような感覚です。
テクニック3: メタプロンプティング
3つ目はメタプロンプティングです。これはGPT-5自体にプロンプトの改善・最適化を依頼するアプローチです。「メタ」は、対象を一つ上の視点から見るというニュアンスで使われます。AI自身にプロンプトを改善してもらう、というわけです。
OpenAIの公式でも、GPT-5の初期テスターがメタプロンプトを使うことで良い結果を得られたと触れられています。やり方は、GPT-5に「どのような要素を追加すれば望ましい結果が出るのか」「どのような要素を削除すれば改善できるのか」を尋ねるだけです。
具体的には、次のように指示します。
AIへの指示
プロンプトの最適化を依頼します。あなたの視点から回答してください。望ましい振る舞いをより安定して引き出したり、望ましくない振る舞いを防いだりするために、私のプロンプトにどのような具体的な言葉を追加、または削除すればよいか説明をお願いします。
改善したいプロンプト
(改善したいプロンプトの全文を貼り付けます)
現状の問題点
このプロンプトで私が期待しているのは、AIが「〇〇」をすることです。しかし、実際には「〇〇」という動きをします。
依頼
元のプロンプトの形をできるだけ崩さずに、この問題を解決するためには、どのような最小限の修正や追加を行えばよいでしょうか?具体的な提案をお願いします。
GPT-5で使うプロンプトを、GPT-5自身に最適化してもらうアプローチです。
3つのテクニックのまとめ
ここで一度まとめます。紹介した3つのテクニックは次のとおりです。
- AIに計画を立てさせる:複雑なタスクは、まず計画を立てさせてから実行させると精度が上がる
- AIに自己評価をさせる:最高の成果物の基準を定義させ、自己評価と修正を繰り返させて品質を高める
- メタプロンプティング:AI自身に、より良い結果を出すためのプロンプト最適化を指示する
計画立案と自己評価に共通するのは、AIにいきなり答えを出させるのではなく「考えるためのプロセス」を与えるという点です。人間も同じで、いきなり仕事に取り掛かるより、一度全体を俯瞰して計画を立てたり基準を設けたりすることで、最終的なアウトプットの質が上がります。
プロンプトオプティマイザーを使う
メタプロンプティングをもう一段深掘りします。先ほどはGPT-5にプロンプト最適化を依頼する方法を紹介しましたが、もう一つ手軽な方法があります。それが、OpenAIが公開している「プロンプトオプティマイザー」というツールを使うことです。
名前のとおり、プロンプトを最適化するツールです。利用にはOpenAIのAPIキーを発行する必要がありますが、使い方は非常に簡単で、ツールを開いて自分のプロンプトを貼り付け、ボタンをクリックするだけ。あとは自動的にGPT-5向けに最適化されたプロンプトに修正してくれます。
修正箇所には修正理由も載るので、新しい発見があって参考になります。「メタプロンプティングをやってみたいけど、自分であれこれ指示するのは面倒」という人にぴったりです。
モデル選択のTIPS
ここからは有料プラン向けのちょっとしたTIPSです。現在チャット画面はGPT-5で統一されていますが、過去のモデルを選択できるようにすることもできます。
やり方は、設定画面から「一般」を選び、「追加モデルを表示する」をオンにするだけです。これでgpt-4.1、o3、o4-miniなどの過去のモデルが使えるようになり、さらに「GPT-5 Thinking Mini」という新しいモデルも選べるようになります。GPT-5のシンキングモードは回答までに時間がかかると感じている人も多いと思いますが、Thinking Miniは回答精度もそこそこ良く、スピードも速いのでおすすめです。
Cursorの興味深い報告
AIコードエディターのCursorが、GPT-5について面白い報告をしているので紹介します。CursorはGPT-5が組み込みで使えるようになっているのですが、当初、コンテキスト収集のタスクで次のような強い言葉のプロンプトを使っていました。
徹底的に情報を収集し、全容を把握するまでツールの呼び出しや質問を使う
ところが、このプロンプトではGPT-5は思ったほどパフォーマンスが上がらなかったそうです。原因を調べたところ、GPT-5はもともと「積極的にコンテキストを収集する」性質を備えているため、このプロンプトが過剰にモデルを動作させる原因になっていたとのこと。
そこでCursorチームは「徹底的に」という文言を削除して表現を和らげました。すると、GPT-5が適切に判断できるようになり、過度な挙動をすることなく自律性を維持できるようになったそうです。
これはけっこう直感に反する話です。「徹底的に」「最大限に」といった強い表現を入れたほうが、AIが最大限のパフォーマンスを出しそうな気がしますよね。でもGPT-5のコンテキスト収集タスクでは逆効果になった、と。開発者向けのTIPSですが、GPT-5では過剰な指示がかえってパフォーマンスを下げることもある、と頭の片隅に置いておくとよいと思います。
補足: Codex CLIについて
最後に、プロンプト改善とは少し話がそれますが、AIを使ったプログラミングに興味がある方への補足です。OpenAIが開発するCodex CLIというツールが、ChatGPTの有料プランに加入していれば制限の範囲内で使えるようになっています。
AIエージェントがプログラミングを手伝ってくれる強力なツールで、Codex CLIにもGPT-5が搭載されて評価が変わってきています。AIコーディングツールを探しているなら、他のツールに課金する前に、まずはこちらを試してみるのもよいと思います。AIコーディングエージェント全般についてはAIコーディングエージェントとは?でも解説しています。
まとめ
最後に今回のポイントをまとめます。
- GPT-5は指示に忠実という特性を持つため、指示が不明瞭だったり矛盾していたりすると性能が落ちる
- より良いプロンプトにするアプローチとして、計画立案・自己評価・メタプロンプティングの3つを紹介した
- OpenAIのプロンプトオプティマイザーを使えば、手軽にメタプロンプティングを試せる
GPT-5の特性を理解してプロンプトを見直せば、回答精度はぐっと上がります。ぜひ自分のタスクに合わせて試してみてください。