こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事ではClaude APIに新しく追加されたAdvisor機能について触れます。

The Advisor Strategy: Give Agents an Intelligence Boost - Anthropic Blog

Advisorとは何か

AIエージェントを構築するとき、常にOpusのような高性能モデルを使うとコストがかさみます。かといってSonnetやHaikuだけでは、複雑な判断で詰まることがある。

Advisorはこの問題に対するAnthropicの回答です。

タスクの実行役としてSonnetやHaikuを使いつつ、行き詰まったときだけOpusに相談できる仕組みです。ツールとしてAPIに組み込まれているので、既存のコードに数行追加するだけで使えます。

どう動くのか

流れはシンプルです。

  1. SonnetやHaikuがタスクを実行する
  2. 判断に迷ったとき、Advisorツール(Opus)を呼び出す
  3. Opusが方針・修正案・停止判断などを返す
  4. 実行役がその助言をもとに処理を再開する

Advisorはあくまで助言するだけで、ツールの実行は行いません。実行の主導権は常にExecutor側にあります。

これによりOpusの性能に近づけつつ、コストを安く抑えることが可能となります。

言われてみればシンプルな戦略ですが、これをエージェントのワークフローに持ってくるとは...

実装方法

Messages APIのtools配列にadvisor_20260301を追加するだけです。

response = client.messages.create(
    model="claude-sonnet-4-6",  # 実行役
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",  # 助言役
            "max_uses": 3,
        },
        # 他のツール
    ],
    messages=[...]
)

max_usesで1リクエストあたりのAdvisor呼び出し回数を制限できます。AdvisorのトークンはOpus料金、Executorのトークンは各モデルの料金で課金されます。

パフォーマンスとコスト

気になるのは実際の効果です。

Sonnet + Opus Advisor

ベンチマーク 結果
SWE-bench Multilingual Sonnet単体から2.7ポイント向上
コスト タスクあたり11.9%削減
BrowseComp / Terminal-Bench 2.0 性能向上しつつコスト削減

Sonnet単体よりも性能が上がって、コストは下がる。素直に良い結果です。

Haiku + Opus Advisor

ベンチマーク 結果
BrowseComp 19.7% → 41.2%(2倍以上)
コスト Sonnet単体比で85%安い
性能差 Sonnet単体比で29%低い

Haikuの場合はさすがにSonnetには及びませんが、コストが85%安いのは魅力的です。大量のタスクを処理する用途では十分な選択肢になりそうです。

使いどころ

個人的に面白いと思ったのは、Advisorが1回の相談で400〜700トークン程度しか生成しない点です。助言はコンパクトで、Opusをフルに回すのとは全く別物のコスト構造になっています。

既存のツール(Web検索、コード実行など)とも併用できるので、今のエージェント構成にそのまま追加できます。

BoltのCEOも「シンプルなタスクではオーバーヘッドなし、複雑なタスクではより良い判断ができる」とコメントしています。

例えば、カスタマー対応向けのエージェントを構築するとします。

高品質な応対を目指すのであれば最初から最上位モデルのOpusを使った方が顧客体験は良くなると思います。

しかし、事業者側のコストがかさむ問題も出てきます。

そこで今回Claudeが発表したアドバイザー戦略を用いると、普段の応対はSonnetで対応し問題が出た時にはOpusで巻き取るようなパイプラインを実現できます。

Opusでも対応できない案件は人間にエスカレーションするみたいな実装も含めると、なお良いと思います。

コストと性能のバランスを取る選択肢

Advisor機能は「全部Opusで動かす」か「安いモデルで妥協する」かの二択ではない、中間のアプローチを提供しています。実装コストも低いので、エージェント開発をしている方は試してみる価値があるかなと思います。