Stanford AI Lab Blog

AIの最新動向を毎日お届け。要点だけをシンプルに。

→ 注目トピックはこちら

[お知らせ] iOS版をリリースしました🎉

強化学習による複雑なインタラクティブなコーディングプログラムの採点

  • オンラインのコーディング教育で、ゲームなどの複雑な課題の自動採点が課題となっている。
  • AIがゲームをプレイすることで課題を評価する「Play to Grade Challenge」を提案し、ソースコードを見ずに採点可能にした。
  • この手法は、教師による手動採点の手間を減らし、より多くの生徒にフィードバックを提供できる可能性がある。

機械学習モデルが犯す体系的なエラーの発見

  • 機械学習モデルが、検証データの一部で系統的な誤りを起こす現象に着目した記事。
  • モデルの性能が低いデータ集団(スライス)を自動で特定する手法Dominoが提案されている。
  • Dominoは、画像とテキストを同じ空間に埋め込み、エラーが多い領域を特定し、自然言語で説明する。