プロンプトを2回入力すると回答精度は上がる？Googleの論文を検証

矢野哲平2026-01-13

こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事では、AIへの指示を2回繰り返すと回答精度が上がるという研究結果について触れます。

これは2025年12月にGoogle Researchから発表された論文に基づく内容です。簡単に使えて、しかも効果があるアプローチなので、今回紹介することにしました。

この記事で解説するポイントは次の3つです。

AIへの指示を2回繰り返すことの効果（論文の内容）
なぜ指示を2回繰り返すと回答精度が上がるのか
関連して、プロンプトの順番の重要性について

Morning AI

AI専門のニュースアプリ。毎朝、世界のAIトレンドを日本語で。

4.7・App Store — 無料

iOS版

AIへの指示を2回繰り返すと精度が上がる

2025年12月、Google Researchから「Prompt Repetition Improves Non-Reasoning LLMs（プロンプトの反復は非推論型LLMを向上させる）」という論文が発表されました。

少し難しいタイトルですが、簡単に言うと、AIへの指示を2回繰り返すことで性能が向上した、という内容です。やることは本当にそのままで、AIへの指示をコピペして2回繰り返すだけです。

たとえば、ニュースタイトルをカテゴリーごとに分類するタスクをAIにやらせるとします。「OpenAI、新モデル発表」ならテクノロジー、「日経平均株価、最高値を更新」なら経済、といった具合です。AIへの指示は、通常こんな形でしょう。

次のニュースタイトルを「スポーツ」「政治」「テクノロジー」「経済」のいずれかに分類してください。 {{ニュースタイトル}}

論文のアプローチを採用すると、次のようになります。

次のニュースタイトルを「スポーツ」「政治」「テクノロジー」「経済」のいずれかに分類してください。 {{ニュースタイトル}} 次のニュースタイトルを「スポーツ」「政治」「テクノロジー」「経済」のいずれかに分類してください。 {{ニュースタイトル}}

何も難しいことはしていません。指示を2回繰り返しただけです。「こんなことで本当に精度が上がるのか」と疑問に思う方も多いと思いますが、実験ではかなり良い結果が報告されています。

実験に使われたモデルも幅広く、GoogleのGemini、OpenAIのGPT、AnthropicのClaude、そしてDeepSeekなどが使われています。つまり、特定のAIだけに通用するテクニックではなく、多くのAIで汎用的に使えるアプローチだということです。さまざまなモデルで実験した結果、2回繰り返したほうが多くのタスクで良い結果を得られた、と報告されています。

なぜ繰り返しが有用なのか

では、なぜこの繰り返しが効果的なのでしょうか。これは生成AIが指示を処理する順番に関係しています。

ここで、プロンプトの順番について少し掘り下げます。次のAIへの指示は、AとBどちらが適切でしょうか。

A: 「次の英語を日本語に翻訳してください」と書いてから、英語のテキストを貼り付ける
B: 先に英語のテキストを貼り付けてから、「次の英語を日本語に翻訳してください」と書く

答えはAです。先に「日本語に翻訳してください」と明示してから、英語のテキストを貼り付けるほうが良いとされています。

理由は、生成AIが指示を前から順番に処理するという特性にあります。Bのように先に英語テキストを提示されても、AIは最初の段階では、その英語をどう処理すればいいのか分かりません。日本語に翻訳するのか、スペイン語に翻訳するのか、文字数をカウントするのか。何をすればいいのか、後半まで分からないわけです。

正直に言うと、今のAIは性能が高いので、AでもBでも翻訳タスクは精度高くこなしてくれます。ただ、厳密に言えば、指示を作るときはこの処理の順番を意識する必要があります。

これは人間に置き換えると分かりやすいです。会社で上司からいきなり英語の資料を渡されても、その時点では何をすればいいか分かりません。先に「今から渡すこの英語資料を来週までに翻訳してレポートを作成してください」と言われてから資料を受け取るほうが、スマートに動けますよね。

話を本題に戻すと、指示を2回繰り返すということは、AIが2回目の指示を読むときには、すでに1回目の指示を背景情報として把握していることになります。1回目の指示が全体像を伝え、2回目の指示を正しく理解するためのガイドとして作用しているわけです。

これも、初見の試験問題を解く場面に置き換えると分かりやすいです。一度ざっと下読みをしてから、もう一度同じ問題を読みながら解くほうが、理解度に差が出ます。2回目を読むときには、どこに何が書いてあるかが頭に入っているからです。

このアプローチの面白いところは、既存の指示を簡単に改善できる点です。たとえば私はニュースタイトルから自動でタグ付けするタスクをAIにやらせているのですが、こうした指示を改良したいとき、シンプルに指示をコピペして2回貼り付けるだけで精度の向上が見込めます。導入しやすく効果的なので、「このタスク、もっと精度を上げたいな」というときに試してみると面白いと思います。

注意点：推論モデルと3回以上の繰り返し

ただし、いくつか注意点があります。

この「2回繰り返し」のアプローチは、非推論モデルに効果的とされています。逆に言うと、推論モデルではあまり効果が得られませんでした。

ここでいう推論モデルとは、AIが思考を重ねて回答を生成するモデルのことです。ChatGPTやGeminiでは、チャット画面で思考モード（シンキングモード）を選べます。思考させて回答するモードと、思考させず瞬時に回答するモード、大きくこの2つがあります。

論文では、思考モードを使っている場合、この2回繰り返しはあまり効果的ではないと報告されています。推論モデルは回答を生成する過程でユーザーの指示を自ら反芻していて、そのプロセスがちょうど「2回繰り返し」に相当する働きをしているのではないか、と考えられています。

もう一つ、3回以上の繰り返しについても言及されています。「2回で効果が上がるなら、3回4回繰り返せばもっと上がるのでは？」と思いますが、そうではないようです。論文では最大3回までの実験が行われ、3回繰り返すと、タスクによっては2回より精度が上がるものもあれば、ほとんど変わらないものもあった、と報告されています。

3回繰り返しが特に効いたのは、「50人の名前のリストから特定の人が何番目にいるかを当てる」といったタスクです。「〇〇の情報は何行目にありますか」「何番目ですか」というような問いは、AIが意外と苦手とする領域です。こうしたタスクでは3回繰り返しが大幅に精度を上回りました。ただし、すべてのタスクで無条件に3回がベストというわけではなく、2回と同程度か、わずかに上がる程度のものも多かったようです。

実際に試してみた

私もいくつかのタスクで試してみました。最新モデルは性能が良すぎて差が分かりにくいので、あえて小型のモデルで比較しています。

要約のタスク（長文から主張や重要ポイントを3つ抽出）: 正直そこまで差は感じませんでした。
文章校正のタスク: 明らかに差が出ました。2回繰り返したほうが精度高く処理してくれました。
分類のタスク（ニュースをジャンルごとに分類）: こちらも2回繰り返したほうが精度が高かったです。

試した感想としては、アイデア出しや要約のようなクリエイティブ寄りのタスクではあまり差が出ない一方、文章校正や分類のように、テキスト全体から特定の情報を抽出するタスクでは効果が高いと感じました。実験でも「リストから特定のワードが何番目にあるか」という情報抽出系のタスクで強みを発揮すると述べられていたので、この傾向と一致します。