Hugging Face Blog

AIの最新動向を毎日お届け。要点だけをシンプルに。

→ 注目トピックはこちら

[お知らせ] iOS版をリリースしました🎉

Hugging Face Blog

vLLMサーバーをHF Jobsでワンコマンドで実行する

  • コマンド1行でHugging FaceのGPU上にOpenAI互換のLLMサーバーを立ち上げられる機能が公開された
  • サーバーの準備不要・秒単位課金で、テストや評価用のモデル実行環境を素早く構築できる
  • 短期的な実験向けのHF Jobsと、長期運用向けのInference Endpointsを用途で使い分けることが想定されている
Hugging Face Blog

ハイブリッドモデルはどのトークンをより正確に予測するか?

  • トランスフォーマーとハイブリッドモデルの7Bモデル同士を比較し、トークン種別ごとの予測精度の差を分析した
  • ハイブリッドモデルは名詞・動詞・形容詞など意味を持つ単語の予測が得意で、文中の繰り返し表現では優位性がほぼ消える
  • 全トークンの平均損失だけでは構造の違いが見えにくく、トークン種別を絞った評価が設計改善に有効だと示された
Hugging Face Blog

FFASRリーダーボード登場:現実世界におけるASRのベンチマーキング

  • 音声認識モデルを現実の部屋環境で評価する初のオープンな比較ランキング「FFASRリーダーボード」が公開された
  • 標準的なテストで高得点でも、実際の部屋では精度が大きく落ちる問題を可視化・比較できるようになった
  • 近距離・クリーン音声での評価が主流な現状では見えにくかった実環境での性能差を、開発者が判断材料にできる
Hugging Face Blog

NVIDIAのNeMo AutoModelでTransformersのファインチューニングを加速する

  • NVIDIAがHuggingFace Transformers v5上で動くオープンライブラリ「NeMo AutoModel」を公開した
  • インポート1行を変えるだけで、v5比3.4〜3.7倍の学習速度と29〜32%のGPUメモリ削減を実現できる
  • 550Bの大規模モデルもv5単独ではメモリ不足で動かない環境で、専門家分散技術により学習可能になる
Hugging Face Blog

Transformers.jsで提案されているCross-Origin Storage APIを試してみる

  • ブラウザのキャッシュが異なるサイト間で共有されない問題を解決するため、クロスオリジンストレージ(COS)APIが提案された
  • 同じAIモデルやWasmファイルを複数サイトが重複ダウンロードせず、ハッシュ値で一致確認して使い回せる仕組みを導入する
  • Transformers.jsがすでに実験的に対応しており、拡張機能で今すぐ試せるが、ブラウザへの正式実装はまだ決まっていない
Hugging Face Blog

CUGAを使って本格的なエージェントアプリを構築する:軽量ハーネス上で動く約24種類の実践サンプル集

  • CUGAというオープンソースのエージェント基盤が公開され、24種類の動作サンプルアプリが提供された
  • ツール一覧とプロンプトを書くだけでAIエージェントアプリが作れ、制御・承認・安全対策が最初から組み込まれている
  • 開発環境で作ったエージェントをコード変更なしに本番環境へ展開できる設計は、企業向けガバナンス要件への対応を簡略化する
Hugging Face Blog

AIとオープンソースツール、そして人間の監督によるhuggingface_hubの毎週リリース

  • Pythonライブラリ「huggingface_hub」のリリース作業を自動化し、リリース頻度を4〜6週間に1回から毎週に引き上げた
  • オープンソースのツールと公開モデルでリリースノート作成を自動化しつつ、人間が最終確認する仕組みで品質を担保している
  • 1回あたり約0.25ドルで運用でき、ワークフロー全体が公開されているため他のライブラリ開発者もそのまま流用できる
Hugging Face Blog

ローカルモデルを使ってOpenClawリポジトリのトリアージを無料で実現した!

  • オープンソースリポジトリのIssue・PRを、ローカルで動く小型AIモデルを使って自動分類・通知するシステムを構築した
  • クラウドAPIに依存せず自前ハードウェアで同等の仕分けをほぼ無料かつリアルタイムに実現できる
  • クラウドモデルがサービス終了するリスクが意識されるなか、ローカルモデルで業務を動かす選択肢の実用性が示された
Hugging Face Blog

Hugging Face上のPP-OCRv6:1.5Mから34.5MパラメータによるOCR 50言語対応

  • 1.5百万から34.5百万パラメータの3段階構成で、50言語対応のOCRモデル群PP-OCRv6が公開された
  • 前世代より文字検出で4.6ポイント、文字認識で5.1ポイント精度が向上し、複数の実行環境に対応している
  • 軽量モデルでも多言語・多用途に対応する設計で、エッジ端末からサーバー処理まで幅広い用途に使える
Hugging Face Blog

MosaicLeaks: あなたのリサーチエージェントは秘密を守れるか?

  • 調査AIが外部検索を行う際、複数のクエリを組み合わせると社内の機密情報が漏れる「モザイク効果」が確認された
  • 性能向上だけを目的に学習させると情報漏洩率が34.0%から51.7%に悪化し、プライバシーと性能はトレードオフになりやすい
  • プライバシーを考慮した強化学習(PA-DR)により、漏洩率を9.9%まで下げつつ正答率も58.7%に維持でき、口頭指示だけでは不十分なことが示された
Hugging Face Blog

LoRAを超えて:最も人気のあるファインチューニング手法を上回ることはできるか?

  • LoRAがPEFT手法の98.4%を占める一方、ベンチマークでは画像生成タスクでOFTがLoRAより精度・メモリ効率ともに上回った
  • LoRAの圧倒的普及は性能の優秀さではなく知名度や情報量の多さによる自己強化の側面があり、必ずしも最適な選択ではない
  • PEFTライブラリの統一APIにより手法の切り替えはコード1行で済むため、用途に応じて複数手法を試す障壁は低い
Hugging Face Blog

エージェント性は十分か?独自ツールでオープンモデルをベンチマークする

  • AIエージェントがコードを書いてライブラリを操作する時代に、正解率だけでなく所要ターン数・トークン数・エラー率も測定できる評価ツールを公開した
  • CLIとSkillの追加は大規模モデルの作業コストを下げる一方、小規模モデルでは誤動作や精度低下を引き起こすことが判明した
  • ライブラリの変更がモデルの規模によって正反対の効果をもたらすため、エージェント向けの機能追加は複数サイズのモデルで事前に検証する必要がある
Hugging Face Blog

エージェンティックリソースディスカバリー:エージェントに検索させる

  • AIエージェントが必要なツールや他のエージェントを実行時に自動で検索できる仕様「ARD」が公開された
  • 事前にツールを手動で設定しなくても、自然言語で意図を伝えるだけで必要な機能を動的に探せるようになる
  • Microsoft・Google・Hugging Faceなど複数社が共同で策定した共通規格であり、特定製品に依存しない
Hugging Face Blog

MolmoMotion: 言語guided 3Dモーション予測

  • 言語指示と画像から物体の3D軌跡を予測するモデル「MolmoMotion」と、116万本の動画データセット「MolmoMotion-1M」が公開された
  • テキストで指定した動作を物体がどう動くか3D空間で予測でき、ロボット制御や動画生成の精度向上に活用できる
  • モデル・データ・ベンチマークをすべて無償公開しており、ロボティクスや映像生成など幅広い分野での応用研究が進みやすい環境が整った
Hugging Face Blog

Hugging Face HubからStrands AgentsとLeRobotを使ってロボットハードウェアへ

  • ロボット制御の記録・訓練・展開・複数台協調を一つのAIエージェントループで完結させるSDKが公開された
  • これまで別々のツールが必要だった一連の作業を、同一コードで実機とシミュレーションの両方に対応できる
  • データ形式やエージェントコードを変えずに環境を切り替えられる設計は、ロボット開発の試行錯誤を大幅に簡略化しうる
Hugging Face Blog

GLM-5.2:長期的なタスクのために構築された

  • 長期タスク向け新モデルGLM-5.2が公開され、100万トークンのコンテキスト対応と強化されたコーディング能力を備える
  • オープンソースモデルとして長期タスク系ベンチマーク全3種で最高順位を獲得し、有料モデルとの差を大幅に縮めた
  • MITライセンスで地域制限なく公開されており、商用・研究問わず制約なく利用できる環境が整った
Hugging Face Blog

GitHub CIをHugging Face Jobsに移行する

  • GitHub ActionsのCIをHugging Face Jobs上で実行する方法を解説
  • `runs-on`のラベルを変えるだけでCPU・GPU両対応のCIが動く
  • CPU処理が約30%高速化し、GPU테스트も低コストで実現できる
Hugging Face Blog

Cohere初の開発者向けモデル、North Mini Codeのご紹介

  • CohereがオープンソースのコーディングAIモデル「North Mini Code」を公開
  • 同サイズ帯の他モデルを上回るコーディング性能を持ち、Apache 2.0で無料利用可能
  • OpenCode・Cohere API・HuggingFaceから今すぐ試せる