A New Framework for Evaluation of Voice Agents (EVA)の評価に向けた新しいフレームワーク音声AIエージェントを総合評価するフレームワーク「EVA」を公開タスク完了率が高いエージェントほど会話体験が悪くなるトレードオフを発見20システムを比較できるベンチマークとコードをオープンソースで利用可能2026-03-24Hugging Face Blog
1日以下で特定分野向け埋め込みモデルを構築するドメイン特化の埋め込みモデルを1日以内に構築できるパイプラインを公開ラベルなしで合成データを生成し、ハード負例学習で精度を10〜26%改善できる6つのコマンドで文書収集からモデル配備まで完結し、本番環境に即投入できる2026-03-21Hugging Face Blog
Nemotron 3 Content Safety 4B: マルチモーダル・多言語コンテンツモデレーションテキストと画像を同時に判定できる多言語コンテンツ安全モデルを公開12言語対応・84%の精度を達成し、同規模の競合モデルを上回る性能Hugging Faceで無料公開、AIエージェントへの組み込みが容易2026-03-21Hugging Face Blog
Mellea 0.4.0の新機能 + Granite LibrariesのリリースMellea 0.4.0とGraniteライブラリ3本を同時リリースLoRAアダプターで幻覚検出や安全性チェックなど特定タスクを高精度に実行できるAIワークフローの構造化・検証・安全管理を低コストで実装できる2026-03-20Hugging Face Blog
SPEED-Benchの紹介:推測デコーディングのための統一的で多様なベンチマークLLM推論を高速化する「投機的デコード」の評価基準SPEED-Benchを公開ドメインやバッチサイズ、入力長など実運用に近い条件で精度とスループットを測定できるランダムトークンによる従来の計測がスループットを約23%過大評価することを示した2026-03-19Hugging Face Blog
Nemotron 3 Nano 4B: 効率的なローカルAIのためのコンパクトなハイブリッドモデルNVIDIAがハイブリッド構造の小型AIモデル「Nemotron 3 Nano 4B」を公開VRAMが少なく、エッジデバイスでも高速・低コストで動作できるJetsonやRTX GPUで即使用でき、組み込みやゲームAIに活用できる2026-03-18Hugging Face Blog
Hugging Faceのオープンソース状況:2026年春版Hugging Face上のオープンソースAIが急成長し、ユーザー1100万人・モデル200万超に達した中国モデルのダウンロード数が米国を抜き、Qwen派生モデルは20万超に拡大したロボティクスや科学分野への広がりが進み、開発・応用の主要基盤となっている2026-03-18Hugging Face Blog
Holotron-12B - 高スループットコンピュータ使用エージェントH CompanyがコンピュータAIエージェント向けモデルHolotron-12Bを公開SSMアーキテクチャにより、同GPU上で旧モデル比2倍以上のスループットを達成Hugging Faceで無償公開されており、データ生成や強化学習に活用できる2026-03-17Hugging Face Blog
ヘルスケアロボティクス向けの初の統合データセットと基礎物理AIモデル医療ロボット向け初の大規模オープンデータセット「Open-H-Embodiment」を公開778時間の手術・超音波データを基に縫合実行AIと手術シミュレーターを開発データセットとモデルはHugging FaceとGitHubで無償公開・活用できる2026-03-17Hugging Face Blog
データサイエンティストのように思考するエージェントを構築する:再利用可能なツール生成によりDABStepで1位を獲得した方法NVIDIAがデータ分析を自動化するAIエージェントの最新技術を公開しました。解析用の共通ツールを自ら作成し、再利用することで処理を大幅に高速化しました。複雑な表データの読み込みや集計を、専門家のように正確かつ迅速に行えます。2026-03-13Hugging Face Blog
NVIDIA AI-QがDeepResearch Bench IおよびIIで1位を獲得した方法NVIDIAのAI-Qが調査用AIの主要な性能テストで世界1位を獲得した。計画や調査を担う複数のAIが連携し、根拠のある報告書を自動生成する。企業は公開された設計図を活用し、自社専用の高度な調査AIを開発できる。2026-03-12Hugging Face Blog
Code Concepts:プログラミング概念のシードから生成された大規模合成データセットプログラミング概念を基にした1500万件のPython学習用データセットが公開された。体系的な知識分類から良質なデータを生成し、モデルのコード解答精度を向上させた。手法とデータが公開されており、特定のスキルに特化したAI開発に広く活用できる。2026-03-12Hugging Face Blog
NVIDIAがAI向けのオープンデータを構築する方法NVIDIAがAI開発を加速させる大規模なオープンデータセットを公開した。ロボットや言語モデルなど多様な分野の高品質な学習データを無償で提供する。開発者はコストを抑えながら高性能な独自のAIを短期間で構築できる。2026-03-11Hugging Face Blog
Hugging Face HubにおけるStorage Bucketsのご紹介Hugging Faceが中間データ保存用のストレージ機能を提供開始しました。重複データを自動で省く仕組みにより、大容量の転送や保存を効率化できます。開発者はCLIやPythonを使って、機械学習の膨大なデータを手軽に管理できます。2026-03-11Hugging Face Blog
トークンを流し続ける:16のオープンソースRLライブラリから得られた教訓16の公開ライブラリが強化学習の待ち時間を解消する設計手法を共有している。推論と学習を別々のGPUで並列に行い、計算待ちによる機材の無駄を排除する。大規模なモデルを学習させる際の、速度低下やGPUの無駄を防ぐ構成が選べる。2026-03-10Hugging Face Blog
LeRobot v0.5.0: あらゆる次元でのスケーリングロボット開発ライブラリLeRobotの最新版v0.5.0が公開された。二足歩行ロボットへの対応や、最新のAIモデルが大幅に拡充された。データの収集や学習が高速化し、開発の待ち時間が大幅に短縮される。2026-03-10Hugging Face Blog
Ulysses Sequence Parallelism:100万トークンのコンテキストを用いた学習百万トークンの長文を効率よく学習する手法Ulyssesが開発されました。複数のGPUに処理を分散させ、膨大なデータを扱う際のメモリ不足を解消します。Hugging Faceのツールを使い、専門的な文書やコードを容易に学習できます。2026-03-10Hugging Face Blog
Granite 4.0 1B Speech:コンパクト、多言語対応、エッジ向けに構築IBMが軽量で多言語対応の音声認識AIモデルを公開しました。日本語に対応し低スペックな機器でも高速に動作します。商用利用可能なライセンスで高性能な音声認識機能を導入できます。2026-03-10Hugging Face Blog
NVIDIA NeMo Evaluator Agent Skillsで、対話型LLMの評価をわずか数分で実現NVIDIAが対話形式でLLMの性能評価を自動設定できる機能を公開しました。複雑なYAML作成を省き、会話だけで評価環境の構築が可能です。設定の手間やミスをなくし、本来の評価作業に集中できるようになります。2026-03-07Hugging Face Blog
Modular Diffusers のご紹介 — Diffusion Pipelines のための組み合わせ可能なビルディングブロック生成工程を部品化して自由に組めるModular Diffusersが登場しました。ブロックを自在に繋ぎ、特定の機能を後から入れ替えたり追加したりできます。独自の生成手順を効率よく構築でき、作成した部品の共有や再利用が捗ります。2026-03-06Hugging Face Blog