Hugging Face Blog

AIの最新動向を毎日お届け。要点だけをシンプルに。

→ 注目トピックはこちら

[お知らせ] iOS版をリリースしました🎉

TransformersにおけるMixture of Experts (MoEs)

  • TransformersでAIモデルの処理を高速化するMoEの実装が進化している。
  • 必要な部品だけを動かすことで、巨大なモデルでも高速な推論が可能になる。
  • 新しいデータの読み込み機能により、高性能なAIを少ない計算資源で活用できる。

JetsonでオープンソースのVision Language Models (VLM)を展開する

  • NVIDIA Jetsonデバイスで、視覚と言語を組み合わせたAIモデル「Cosmos Reasoning 2B」を動かす方法を解説。
  • モデルはNGCからダウンロードし、vLLMフレームワークとDockerを使ってJetson AGX Thor/Orin/Orin Nano Superで実行可能。
  • 読者は、WebUIを通じてリアルタイムでカメラ映像を解析し、インタラクティブな物理AIアプリケーションを構築できる。

UnslothとHugging Face JobsでAIモデルを無料でトレーニング

  • UnslothとHugging Face Jobsを使って、LLM(言語モデル)の高速なファインチューニングができる。
  • LiquidAI/LFM2.5-1.2B-Instructのような小規模モデルは、学習コストが低く、様々な環境で利用可能。
  • 無料クレジットを利用してモデルを学習でき、Claude CodeやCodexなどのコーディングエージェントで簡単に実行可能。

Gradioのgr.HTMLで、どんなWebアプリも一発作成

  • Gradio 6で、gr.HTMLがカスタムテンプレート、CSS、JavaScriptに対応した。
  • LLM(Claude等)で、ウェブアプリのフロントエンド、バックエンドを1つのPythonファイルで生成可能。
  • gr.HTMLで、特別なUIコンポーネントを構築し、AIアプリ開発のスピードを向上できる。

CodexとClaudeによるカスタムカーネルの提供

  • 開発者は、AIエージェント(Claude、Codex)にCUDAカーネルを生成させるスキルを構築した。
  • このスキルは、GPUアーキテクチャに合わせた最適化やライブラリとの連携に必要な知識を提供する。
  • 開発者は、生成されたカーネルをHuggingFace Kernel Hubで共有し、再利用可能にした。

実践的なOpenEnv:現実世界環境におけるツール使用エージェントの評価

  • OpenEnvは、AIエージェントを現実世界で評価するためのオープンソースフレームワークである。
  • カレンダー管理環境「Calendar Gym」により、複雑なタスクにおけるエージェントの弱点が判明した。
  • 複数ステップの推論、曖昧さへの対応、正確なツール実行が、実用的なエージェント構築の鍵となる。

Transformers.js v4 プレビュー版:NPMで公開開始!

  • Transformers.js v4のプレビュー版がNPMで公開され、GitHubからの直接インストールは不要になった。
  • 新しいWebGPUランタイム採用で、パフォーマンス向上と幅広いJavaScript環境での利用が可能になった。
  • リポジトリの構造変更、モデルの追加、ビルドシステムの改善により、開発効率と使いやすさが向上した。

グローバルなオープンソースAIエコシステムの未来:DeepSeekからAI+へ

  • 中国のAI業界では、DeepSeek R1以降「DeepSeek Moment」と呼ばれるオープンソースAIの動きが活発化している。
  • 主要なAI組織(Alibaba、Tencent、ByteDance、Baiduなど)が、モデルや技術を積極的に公開し、エコシステムを構築している。
  • 研究者や開発者は、オープンソースを活用することで、中国のAI技術発展に貢献し、新たな応用分野を開拓できる。