Hugging Face BlogvLLMサーバーをHF Jobsでワンコマンドで実行するコマンド1行でHugging FaceのGPU上にOpenAI互換のLLMサーバーを立ち上げられる機能が公開されたサーバーの準備不要・秒単位課金で、テストや評価用のモデル実行環境を素早く構築できる短期的な実験向けのHF Jobsと、長期運用向けのInference Endpointsを用途で使い分けることが想定されている
Hugging Face Blogハイブリッドモデルはどのトークンをより正確に予測するか?トランスフォーマーとハイブリッドモデルの7Bモデル同士を比較し、トークン種別ごとの予測精度の差を分析したハイブリッドモデルは名詞・動詞・形容詞など意味を持つ単語の予測が得意で、文中の繰り返し表現では優位性がほぼ消える全トークンの平均損失だけでは構造の違いが見えにくく、トークン種別を絞った評価が設計改善に有効だと示された
Hugging Face BlogFFASRリーダーボード登場:現実世界におけるASRのベンチマーキング音声認識モデルを現実の部屋環境で評価する初のオープンな比較ランキング「FFASRリーダーボード」が公開された標準的なテストで高得点でも、実際の部屋では精度が大きく落ちる問題を可視化・比較できるようになった近距離・クリーン音声での評価が主流な現状では見えにくかった実環境での性能差を、開発者が判断材料にできる
Hugging Face BlogNVIDIAのNeMo AutoModelでTransformersのファインチューニングを加速するNVIDIAがHuggingFace Transformers v5上で動くオープンライブラリ「NeMo AutoModel」を公開したインポート1行を変えるだけで、v5比3.4〜3.7倍の学習速度と29〜32%のGPUメモリ削減を実現できる550Bの大規模モデルもv5単独ではメモリ不足で動かない環境で、専門家分散技術により学習可能になる
Hugging Face BlogTransformers.jsで提案されているCross-Origin Storage APIを試してみるブラウザのキャッシュが異なるサイト間で共有されない問題を解決するため、クロスオリジンストレージ(COS)APIが提案された同じAIモデルやWasmファイルを複数サイトが重複ダウンロードせず、ハッシュ値で一致確認して使い回せる仕組みを導入するTransformers.jsがすでに実験的に対応しており、拡張機能で今すぐ試せるが、ブラウザへの正式実装はまだ決まっていない
Hugging Face BlogCUGAを使って本格的なエージェントアプリを構築する:軽量ハーネス上で動く約24種類の実践サンプル集CUGAというオープンソースのエージェント基盤が公開され、24種類の動作サンプルアプリが提供されたツール一覧とプロンプトを書くだけでAIエージェントアプリが作れ、制御・承認・安全対策が最初から組み込まれている開発環境で作ったエージェントをコード変更なしに本番環境へ展開できる設計は、企業向けガバナンス要件への対応を簡略化する
Hugging Face BlogAIとオープンソースツール、そして人間の監督によるhuggingface_hubの毎週リリースPythonライブラリ「huggingface_hub」のリリース作業を自動化し、リリース頻度を4〜6週間に1回から毎週に引き上げたオープンソースのツールと公開モデルでリリースノート作成を自動化しつつ、人間が最終確認する仕組みで品質を担保している1回あたり約0.25ドルで運用でき、ワークフロー全体が公開されているため他のライブラリ開発者もそのまま流用できる
Hugging Face Blogローカルモデルを使ってOpenClawリポジトリのトリアージを無料で実現した!オープンソースリポジトリのIssue・PRを、ローカルで動く小型AIモデルを使って自動分類・通知するシステムを構築したクラウドAPIに依存せず自前ハードウェアで同等の仕分けをほぼ無料かつリアルタイムに実現できるクラウドモデルがサービス終了するリスクが意識されるなか、ローカルモデルで業務を動かす選択肢の実用性が示された
Hugging Face BlogHugging Face上のPP-OCRv6:1.5Mから34.5MパラメータによるOCR 50言語対応1.5百万から34.5百万パラメータの3段階構成で、50言語対応のOCRモデル群PP-OCRv6が公開された前世代より文字検出で4.6ポイント、文字認識で5.1ポイント精度が向上し、複数の実行環境に対応している軽量モデルでも多言語・多用途に対応する設計で、エッジ端末からサーバー処理まで幅広い用途に使える
Hugging Face BlogMosaicLeaks: あなたのリサーチエージェントは秘密を守れるか?調査AIが外部検索を行う際、複数のクエリを組み合わせると社内の機密情報が漏れる「モザイク効果」が確認された性能向上だけを目的に学習させると情報漏洩率が34.0%から51.7%に悪化し、プライバシーと性能はトレードオフになりやすいプライバシーを考慮した強化学習(PA-DR)により、漏洩率を9.9%まで下げつつ正答率も58.7%に維持でき、口頭指示だけでは不十分なことが示された
Hugging Face BlogLoRAを超えて:最も人気のあるファインチューニング手法を上回ることはできるか?LoRAがPEFT手法の98.4%を占める一方、ベンチマークでは画像生成タスクでOFTがLoRAより精度・メモリ効率ともに上回ったLoRAの圧倒的普及は性能の優秀さではなく知名度や情報量の多さによる自己強化の側面があり、必ずしも最適な選択ではないPEFTライブラリの統一APIにより手法の切り替えはコード1行で済むため、用途に応じて複数手法を試す障壁は低い
Hugging Face Blogエージェント性は十分か?独自ツールでオープンモデルをベンチマークするAIエージェントがコードを書いてライブラリを操作する時代に、正解率だけでなく所要ターン数・トークン数・エラー率も測定できる評価ツールを公開したCLIとSkillの追加は大規模モデルの作業コストを下げる一方、小規模モデルでは誤動作や精度低下を引き起こすことが判明したライブラリの変更がモデルの規模によって正反対の効果をもたらすため、エージェント向けの機能追加は複数サイズのモデルで事前に検証する必要がある
Hugging Face Blogエージェンティックリソースディスカバリー:エージェントに検索させるAIエージェントが必要なツールや他のエージェントを実行時に自動で検索できる仕様「ARD」が公開された事前にツールを手動で設定しなくても、自然言語で意図を伝えるだけで必要な機能を動的に探せるようになるMicrosoft・Google・Hugging Faceなど複数社が共同で策定した共通規格であり、特定製品に依存しない
Hugging Face BlogMolmoMotion: 言語guided 3Dモーション予測言語指示と画像から物体の3D軌跡を予測するモデル「MolmoMotion」と、116万本の動画データセット「MolmoMotion-1M」が公開されたテキストで指定した動作を物体がどう動くか3D空間で予測でき、ロボット制御や動画生成の精度向上に活用できるモデル・データ・ベンチマークをすべて無償公開しており、ロボティクスや映像生成など幅広い分野での応用研究が進みやすい環境が整った
Hugging Face BlogHugging Face HubからStrands AgentsとLeRobotを使ってロボットハードウェアへロボット制御の記録・訓練・展開・複数台協調を一つのAIエージェントループで完結させるSDKが公開されたこれまで別々のツールが必要だった一連の作業を、同一コードで実機とシミュレーションの両方に対応できるデータ形式やエージェントコードを変えずに環境を切り替えられる設計は、ロボット開発の試行錯誤を大幅に簡略化しうる
Hugging Face BlogGLM-5.2:長期的なタスクのために構築された長期タスク向け新モデルGLM-5.2が公開され、100万トークンのコンテキスト対応と強化されたコーディング能力を備えるオープンソースモデルとして長期タスク系ベンチマーク全3種で最高順位を獲得し、有料モデルとの差を大幅に縮めたMITライセンスで地域制限なく公開されており、商用・研究問わず制約なく利用できる環境が整った
Hugging Face Blogolmo-eval: モデル開発サイクルのための評価ワークベンチLLM開発中の繰り返し評価を効率化するツール「olmo-eval」を公開ベンチマーク追加が容易で、チェックポイント間の比較をより詳細に実行できる開発中モデルの継続的な評価フローに活用できる
Hugging Face BlogPyTorchのプロファイリング(第2部):nn.Linearから融合MLPへPyTorchのプロファイラでnn.LinearからMLP構築までを解説`torch.compile`でGeLUとmulが1つのTritonカーネルに融合しHBM転送を削減Liger kernelsを使うと再コンパイルなしで同等の融合カーネルを利用できる
Hugging Face BlogGitHub CIをHugging Face Jobsに移行するGitHub ActionsのCIをHugging Face Jobs上で実行する方法を解説`runs-on`のラベルを変えるだけでCPU・GPU両対応のCIが動くCPU処理が約30%高速化し、GPU테스트も低コストで実現できる
Hugging Face BlogCohere初の開発者向けモデル、North Mini Codeのご紹介CohereがオープンソースのコーディングAIモデル「North Mini Code」を公開同サイズ帯の他モデルを上回るコーディング性能を持ち、Apache 2.0で無料利用可能OpenCode・Cohere API・HuggingFaceから今すぐ試せる