Anthropic Frontier Red Team

AIの最新動向を毎日お届け。要点だけをシンプルに。

→ 注目トピックはこちら

[お知らせ] iOS版をリリースしました🎉

Anthropic Frontier Red Team

LLMのエクスプロイト開発能力の測定

  • 新AIモデル「Mythos Preview」が高度なサイバー攻撃コードを自動生成できる
  • 3つのベンチマークで他モデルを大幅に上回り、実用レベルの攻撃が可能
  • 6〜12ヶ月以内に同レベルの能力が普及し、専門知識不要で悪用されるリスクがある
Anthropic Frontier Red Team

Claude Mythos Previewのサイバーセキュリティ能力を評価する

  • 新AIモデル「Claude Mythos Preview」がOSやブラウザのゼロデイ脆弱性を自動発見できる
  • 27年前のOpenBSDのバグや16年前のFFmpegの脆弱性など、人間が見落とした欠陥を発見した
  • 防御側が攻撃者より先に活用できるよう、限定パートナー向けに「Project Glasswing」を開始した