Anthropic Frontier Red TeamLLMのエクスプロイト開発能力の測定新AIモデル「Mythos Preview」が高度なサイバー攻撃コードを自動生成できる3つのベンチマークで他モデルを大幅に上回り、実用レベルの攻撃が可能6〜12ヶ月以内に同レベルの能力が普及し、専門知識不要で悪用されるリスクがある
Anthropic Frontier Red TeamClaude Mythos Previewのサイバーセキュリティ能力を評価する新AIモデル「Claude Mythos Preview」がOSやブラウザのゼロデイ脆弱性を自動発見できる27年前のOpenBSDのバグや16年前のFFmpegの脆弱性など、人間が見落とした欠陥を発見した防御側が攻撃者より先に活用できるよう、限定パートナー向けに「Project Glasswing」を開始した