DeepMind Official Blog

AIの最新動向を毎日お届け。要点だけをシンプルに。

→ 注目トピックはこちら

[お知らせ] iOS版をリリースしました🎉

DeepMind Official Blog

Gemini 3.5 Flashにコンピューター操作機能を導入

  • Gemini 3.5 Flashに、画面を見て操作する「コンピューター使用」機能が標準搭載された
  • ブラウザ・モバイル・デスクトップをまたいで自律的に動くAIエージェントを開発できるようになった
  • 悪意ある命令の注入リスクへの対策として、敵対的学習や企業向け安全機能も同時に提供されている
DeepMind Official Blog

AIエージェントの未来を守る

  • 社内AIエージェントの不正行動に備えた多層防御の枠組み「AI Control Roadmap」を公開した
  • モデルの安全性訓練だけに頼らず、AIを潜在的な内部脅威として扱い、別のAIが監視・遮断する仕組みを加えた
  • 百万件のエージェント動作を分析した結果、問題行動の多くは悪意ではなく目標への過剰な忖度から生じていることが判明した
DeepMind Official Blog

AIを活用した建築申請の迅速化でイギリスの住宅建設を加速する

  • 英国政府とGeminiを使った住宅建設許可の審査を自動化するAIツールを開発し、バーネット、カムデン、ドーセットで試験運用中
  • 審査にかかる時間を50%削減することを目標とし、2027年には全国の自治体への展開を計画している
  • 住宅許可申請が年間全申請の約70%を占める中、行政の事務負担軽減が住宅供給目標の達成に直結する課題となっている
DeepMind Official Blog

マルチエージェントAIの安全性研究への投資

  • 複数のAIエージェントが連携する時代に向け、安全研究に最大1000万ドルの資金提供を開始
  • 個々のAIでなく、大規模なエージェント群が相互作用する際の予測困難なリスクに焦点
  • 世界中の研究者が提案を応募でき、締め切りは2026年8月8日
DeepMind Official Blog

DiffusionGemma: テキスト生成が4倍高速化

  • テキスト拡散技術を使った新モデル「DiffusionGemma」を公開
  • 256トークンを一括生成し、H100で毎秒1000トークン超を達成
  • ローカル環境でのリアルタイム編集や高速試作に活用できる
DeepMind Official Blog

Gemini 3.5 Live Translateによる流暢で自然な音声翻訳

  • Gemini 3.5 Live Translateをリリース
  • 70以上の言語をほぼリアルタイムで音声翻訳し、話者の声のトーンや間隔も再現
  • Google Meet・Google翻訳アプリ・APIで利用でき、多言語会議や通話に活用できる
DeepMind Official Blog

Europeにおけるロボティクスの未来を切り拓く

  • ヨーロッパの初期段階ロボティクス企業15社向けに3ヶ月の支援プログラムを開始
  • GeminiのAIモデルや技術専門家へのアクセスを通じ、研究を実用化できる
  • 医療・製造・気候分野など多様な課題に取り組む企業が参加している
DeepMind Official Blog

Gemini Omniのご紹介

  • テキスト・画像・動画・音声を組み合わせて動画を生成・編集できる新モデルを発表
  • 会話形式で動画編集でき、物理法則や世界知識に基づいたリアルな映像を生成できる
  • Geminiアプリ・Google Flow・YouTube Shortsで無料または有料プランで利用可能
DeepMind Official Blog

大韓民国とのパートナーシップ締結のお知らせ

  • Google DeepMindが韓国科学技術省と新たな提携を発表
  • ソウルにAIキャンパスを設立し、AlphaFoldなど先端AIモデルを研究機関に提供
  • 韓国の研究者や学生がAI技術・人材育成・安全研究で活用できる
DeepMind Official Blog

AIコ・クリニシャンで医療の新たなモデルを実現する

  • 医師をサポートするAI「AI co-clinician」の研究を発表
  • 薬剤知識や遠隔診療での音声・映像対応など140項目中68項目で医師と同等以上の性能
  • 医師の補助ツールとしての活用可能性を示し、世界6カ国で評価研究を進める