注目トピック🔥
- GeminiアプリにStudy notebooks機能が追加され、学習者向けのパーソナライズされた学習空間が提供される
- 診断クイズで弱点を把握し、100以上の学習目標を軸に進捗を追跡しながら短いレッスンで学べる
- SATはThe Princeton Reviewの問題を元に対応済みで、JEEやGREなど他の試験も夏に追加予定とされている
- Gemini 3.5 Flashに、PC・スマホ・ブラウザを操作できる機能が標準搭載された
- 開発者が画面を見て判断・操作するAIエージェントを、単一モデルで構築できるようになった
- 悪意ある命令の注入対策や企業向け安全機能も同時に提供され、実業務での利用を想定した設計になっている
- BlockがオープンソースのAIコーディングエージェント「Goose」を無料公開し、GitHubで26,100以上のスターを獲得した
- 月額最大200ドルのClaude Codeに対し、Gooseはローカル動作で料金・使用制限なしに同等の機能を提供する
- オープンソースモデルの性能向上が続く中、高額な商用AIツールの優位性が今後狭まる可能性がある
OpenRouter- オープンウェイトモデル4種(DeepSeek V4 Flash、GLM 5.2、MiniMax M3、Nemotron 3 Ultra)が2026年前半に相次いで公開された
- コスト・品質・マルチモーダル・米国産という異なる強みを持つ選択肢が揃い、クローズドモデルとの差が縮まっている
- 性能格差が18カ月以上3〜6カ月差で維持されており、用途に応じてモデルを選ぶ実用段階に入っている
- GPT‑5.6シリーズとして3モデルの限定プレビューを開始した
- 米政府の要請を受け、参加を政府に共有した少数の信頼パートナーに先行公開する形を取った
- 安全対策を備える一方、政府承認を前提とする公開手順の常態化には反対の姿勢を示す
CodeRabbit- AIエージェントに対して手動で指示を出す段階を超え、人間が離れても動き続ける自律ループを設計する手法が注目されている
- ループは単発の指示ではなく再帰的な目標を持ち、スケジュール・状態管理・品質ゲートを組み合わせて人間なしで完結する
- ゴールが安定したタスクには効果的だが、条件が変わり続ける場合は検証器の保守コストがループの利点を打ち消す
- トランプ政権の要請を受け、GPT-5.6の公開を一部企業顧客限定のプレビュー形式に限定することになった
- 政府がセキュリティ上の懸念から、新モデルへのアクセスを案件ごとに審査・承認する仕組みが導入される
- 競合他社への対応と比べ有利な条件とされており、政府とAI企業の関係が製品公開に影響を与えている
- GoogleのAIツール3種類を使うと、就職活動の全工程をサポートできる
- 職種探し・応募書類の改善・面接練習まで、それぞれ専用ツールで対応できる
- 就活の各段階をAIで補えるため、準備にかかる手間や不安を減らせる可能性がある
OpenRouter- コーディング用AIエージェントからリアルタイムのモデル情報を参照できるMCPサーバーが公開された
- エージェントが古い学習データではなく最新の価格・性能・レイテンシで最適モデルを選べるようになった
- 開発中にブラウザに切り替えずモデル比較やドキュメント検索が完結するため、作業の中断が減る
- 開発者向けツールだったCodexが、法務・財務・採用など非技術部門にも広がり、社内の週次出力トークンの99.8%を占めるようになった
- AIとの短い一問一答から、数時間単位の複雑な作業を任せる「エージェント型」利用へと、仕事の単位が変わりつつある
- 非技術職の社員が専門外のコーディングや自動化を自ら担えるようになり、職種をまたいだ業務の境界が薄れてきている
- AIと人間が同じ作業空間で同時に協働する「マルチプレイヤーエージェント」の仕組みと活用法が公開された
- 情報の公開共有・役割の明確化・北極星となる目標設定・信頼の段階的な構築という4つの実践原則が鍵になる
- これらの原則は人間チームの運営で従来から有効とされてきた基本習慣であり、AIが加わることでその徹底がより重要になる
- 推論モードをオンにすると、単純な一問一答でも正解率が上がることをGemini-2.5とQwen3-32Bで確認した
- 推論トークンが計算の余白として働く効果と、関連事実を先に生成することで正解を引き出す効果の2つが要因である
- 推論中に生成した中間事実に誤りが1つでも含まれると正答率が下がるため、正確な中間ステップを学習で促す余地がある
- OpenAIとBroadcomが共同で、LLM向け推論専用チップ「Jalapeño」を発表した
- 汎用チップの転用ではなく、LLM推論に特化した設計で、消費電力あたりの性能が現行最高水準を大幅に上回る見込み
- 設計から製造まで9か月という短期開発を実現しており、AIチップ開発にAI自体を活用する循環が始まりつつある
- SlackでチームメンバーとしてClaudeを招待し、タスクを委任できる新機能「Claude Tag」が公開された
- チャンネル内の全員が同一のClaudeと協力でき、文脈を蓄積しながら非同期でタスクを自律実行できる
- 社内製品チームのコードの65%がすでにClaude Tagで生成されており、エンジニアリング以外の業務にも活用が広がっている
- 複数人が使う共有チャンネルでAIが動く際、個人の認証情報ではなくAI専用のアカウントと権限を設定する仕組みが導入された
- AIがチームの共有空間で自律的に動くには、特定ユーザーの権限に依存しない独立したアクセス管理が必要になる
- 管理者がチャンネル単位でAIの権限範囲を細かく制御できるため、利便性と情報漏えいリスクのバランスを取りやすくなる
- Googleが検索ボックスを25年ぶりに刷新し、テキスト以外に画像・動画・PDFも受け付ける会話型インターフェースに変えた
- キーワード入力を前提とした検索の枠組みが終わり、AIとの対話が検索の標準的な形になった
- AI Modeは月間利用者が10億人を超えクエリ数が四半期ごとに倍増しており、この変化はすでに大規模に進行している
- MetaがRay-Banブランドを離れ、独自デザインのスマートグラスを複数スタイル・カラーで発表した
- Ray-Banとの提携で培ったファッション性を土台に、独立したブランド展開へ踏み出した
- スマートグラスの普及にはデザインの受け入れやすさが重要な要素であることが改めて示されている
- スマートフォンからリモートのPC上でコードを動かし、指示・承認・レビューまでできるアプリの使い方が紹介された
- スマートフォンは開発作業の「操作盤」として機能し、実行はPCに任せつつ人間の判断だけを遠隔で行う設計になっている
- 机を離れていても開発の意思決定が止まらないよう、承認・レビュー・方向修正を一か所に集約する仕組みが整っている
Box Blog- AIによる雇用喪失の懸念とは裏腹に、調査対象企業の58%が今後3年で人員増加を見込んでいる
- AIは単純作業を代替しつつ、監視・統制・設計など新たな職種を各部門に生み出している
- 企業内コンテンツの整備度が新職種の定着を左右するため、情報基盤の構築が競争力の鍵となる
- CodexをAIによる長期的な作業継続のための持続的な作業環境として活用する方法をまとめたガイドが公開された
- 単発の指示で終わらず、複雑な工程や文脈を保ちながらプロジェクトを進められる使い方が紹介されている
- AIへの作業委任と人間による確認の使い分けが、実務での導入判断において重要な視点として示されている