こんにちは、AIニュースアプリ Morning AI 開発者の矢野哲平です。この記事ではOpenAI Codexの大型アップデート「Codex for (almost) everything」について触れます。

Codex for (almost) everything - OpenAI

コーディングエージェントからワークスペースへ

OpenAIがCodexの大型アップデートを発表しました。

コーディングエージェントだったCodexを、より広いタスクに対応するワークスペースへ拡張するアップデートです。

この流れはAnthropicのClaude Desktopに見られるようにエンジニアから非エンジニアへのAIエージェントの利用を加速させる動きです。

なお、今回のアップデートはChatGPTでサインインしているCodexユーザー向けに順次展開されます。

今回の目玉は4つ。Computer Use、アプリ内ブラウザ、画像生成、メモリ機能です。順に見ていきます。

Computer Use

CodexがmacOS上のアプリを直接操作できるようになりました。独立したカーソルで画面の確認、クリック、テキスト入力が可能です。

複数のエージェントがバックグラウンドで並列動作し、ユーザー自身の作業には干渉しません。ネイティブアプリのテスト、シミュレーターの操作、GUI関連のバグ対応などが主なユースケースとして挙げられています。

個人的に、ユーザーの操作を邪魔しない設計は実用面でかなり重要だと思います。

アプリ内ブラウザ

Codexにブラウザが内蔵されました。ローカルホストや公開ページ(サインイン不要のもの)を開けます。

面白いのはページ上に直接コメントを付けてCodexに指示できる点です。「このグラフの余白を調整して、軸が見切れないようにして」のように、レンダリングされた画面を見ながらフィードバックを伝えられます。

テキストで「何行目のCSSを直して」と指示するより、視覚的に伝えるほうが正確なケースは多いので、実用的な機能かなと思います。

画像生成

gpt-image-1.5による画像生成がCodex内に統合されました。

ChatGPTに切り替えなくても、プロダクトコンセプトやモックアップ、フロントエンドデザイン、ゲームアセットなどの画像を生成できます。

メモリ機能

ユーザーの設定やワークフロー、技術スタックを記憶するメモリ機能がプレビューとして追加されました。

中断した作業を既存のスレッドから再開したり、将来のタスクをスケジュールすることが可能です。数日〜数週間にわたるプロジェクトにも対応できます。

プラグインとその他の改善

今回のアップデートで90以上の新プラグインが追加されています。

スキル、アプリ統合、MCPサーバーを組み合わせ、コンテキスト収集とアクション実行の幅を広げる形です。

Jira、GitLab Issues、Microsoft Suite、CI/CDパイプライン、データベースなどとの連携に対応しています。

その他の主な改善点は以下の通りです。

  • GitHubプルリクエストのレビュー対応
  • 複数ターミナルタブの実行
  • SSH経由のリモート開発環境への接続(アルファ版)
  • PDF、スプレッドシート、プレゼンテーションなどのリッチプレビュー

コーディングツールの枠を超え始めたCodex

今回のアップデートで、Codexは明確に「コーディングエージェント」から「開発者向け総合ワークスペース」へ方向転換しています。Computer Useでアプリを操作し、ブラウザでWebページを確認し、画像を生成し、メモリでコンテキストを維持する。コードを書くだけのツールではなくなりました。

ChatGPTにサインインしたCodexデスクトップアプリユーザー向けに提供が開始されています。