NSF AI助成 $100万:生成AIの「アライメント(安全性)」の数理基盤(ペンシルベニア大)
米NSFが、生成AI(大規模言語モデルや拡散モデル)の偏見・不適切な出力といったリスクに、「アライメント」の枠組みで取り組む数理基盤研究に約100万ドルを助成。公開モデルを公平性・安全性・信頼性・真実性の要件に適合させることを目指す。
助成の概要(一次情報)
- 交付額約100万ドル($1,000,000)
- 受給機関University of Pennsylvania(PA)
- プログラムMSPA-INTERDISCIPLINARY, IIS Special Projects, Special Projects - CCF, EPCL: Energy, Power, Control,
- 期間2025-10-01 〜 2028-09-30
- 資金提供米国科学財団(NSF) / NSF
要点
- 生成AI(LLM・拡散モデル)の偏見再生産・不安全/誤誘導出力に「アライメント」で対処
- 公開の汎用生成モデルを公平性・安全性・信頼性・頑健性・真実性に適合させる再学習法を研究
- AIが社会・経済に統合されるうえで必要な基礎研究と位置づけ
- 交付額 約100万ドル・ペンシルベニア大・2025〜2028年
- AI安全性に国費を投じる米国の姿勢を示す(規制と研究投資の両面)
米国科学財団(NSF)は、ペンシルベニア大学(UPenn)の「Mathematical Foundations of Alignment in Generative AI(生成AIにおけるアライメントの数理基盤, MFAI)」に約100万ドル($1,000,000)を交付した(NSF Award 2502489、期間2025年10月〜2028年9月)。
抄録によれば、生成系の大規模言語モデル(LLM)や生成拡散モデル(GDM)は、人間が作ったかのようなコンテンツを生成することで知られる一方、特定の用途では深刻なリスクをもたらしうる。これらのモデルは学習データの偏見(bias)を再生産し、安全でない出力や、誤解を招く・虚偽の・問題のある内容を生成することが知られている。本プロジェクトは、こうした課題に「アライメント(alignment)」という一般的な枠組みで取り組む。
画像・言語生成のための大規模事前学習済みモデルはパブリックドメインで入手できるが汎用的であり、多くの利用者は自分の目的・原則に合わせて再学習(retrain)したいと考える。本研究が成功すれば、公平性・安全性・信頼性・頑健性・真実性といった要件を、よりうまくモデルに組み込めるようになる。これは、社会・経済の基盤に深く統合されていくAIツールにとって必要な発展だとする。技術的にはアライメント問題の3つの性質に基づくアプローチを取る。
なぜ重要か
生成AIの安全性・信頼性(アライメント)に米国が基礎研究として国費を投じていることを示す。AIの偏見・誤情報・安全性は普遍的な論点で、規制と研究投資の両面から米国の取り組みを読む参考になる。
よくある質問(FAQ)
AIの「アライメント」とは?
なぜ重要なのですか?
出典(一次情報)
出典:NSF Award Search(米国科学財団・パブリックドメイン)。金額は交付額(obligated)。個人情報保護のため研究代表者名は扱っていません。
- NSF Award(原文・公式)
- NSF Award ID: 2502489