こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事ではOpenAI Codexの大型アップデート「Codex for (almost) everything」について触れます。
Codex for (almost) everything - OpenAI
コーディングエージェントからワークスペースへ
OpenAIがCodexの大型アップデートを発表しました。
コーディングエージェントだったCodexを、より広いタスクに対応するワークスペースへ拡張するアップデートです。
この流れはAnthropicのClaude Desktopに見られるようにエンジニアから非エンジニアへのAIエージェントの利用を加速させる動きです。
なお、今回のアップデートはChatGPTでサインインしているCodexユーザー向けに順次展開されます。
今回の目玉は4つ。Computer Use、アプリ内ブラウザ、画像生成、メモリ機能です。順に見ていきます。
Computer Use
CodexがmacOS上のアプリを直接操作できるようになりました。独立したカーソルで画面の確認、クリック、テキスト入力が可能です。
複数のエージェントがバックグラウンドで並列動作し、ユーザー自身の作業には干渉しません。ネイティブアプリのテスト、シミュレーターの操作、GUI関連のバグ対応などが主なユースケースとして挙げられています。
個人的に、ユーザーの操作を邪魔しない設計は実用面でかなり重要だと思います。
アプリ内ブラウザ
Codexにブラウザが内蔵されました。ローカルホストや公開ページ(サインイン不要のもの)を開けます。
面白いのはページ上に直接コメントを付けてCodexに指示できる点です。「このグラフの余白を調整して、軸が見切れないようにして」のように、レンダリングされた画面を見ながらフィードバックを伝えられます。
テキストで「何行目のCSSを直して」と指示するより、視覚的に伝えるほうが正確なケースは多いので、実用的な機能かなと思います。
画像生成
gpt-image-1.5による画像生成がCodex内に統合されました。
ChatGPTに切り替えなくても、プロダクトコンセプトやモックアップ、フロントエンドデザイン、ゲームアセットなどの画像を生成できます。
メモリ機能
ユーザーの設定やワークフロー、技術スタックを記憶するメモリ機能がプレビューとして追加されました。
中断した作業を既存のスレッドから再開したり、将来のタスクをスケジュールすることが可能です。数日〜数週間にわたるプロジェクトにも対応できます。
プラグインとその他の改善
今回のアップデートで90以上の新プラグインが追加されています。
スキル、アプリ統合、MCPサーバーを組み合わせ、コンテキスト収集とアクション実行の幅を広げる形です。
Jira、GitLab Issues、Microsoft Suite、CI/CDパイプライン、データベースなどとの連携に対応しています。
その他の主な改善点は以下の通りです。
- GitHubプルリクエストのレビュー対応
- 複数ターミナルタブの実行
- SSH経由のリモート開発環境への接続(アルファ版)
- PDF、スプレッドシート、プレゼンテーションなどのリッチプレビュー
コーディングツールの枠を超え始めたCodex
今回のアップデートで、Codexは明確に「コーディングエージェント」から「開発者向け総合ワークスペース」へ方向転換しています。Computer Useでアプリを操作し、ブラウザでWebページを確認し、画像を生成し、メモリでコンテキストを維持する。コードを書くだけのツールではなくなりました。
ChatGPTにサインインしたCodexデスクトップアプリユーザー向けに提供が開始されています。