大規模言語モデルの内部動作の理解

情報科学研究科

湯本　高行・准教授

近年、ChatGPTなどの大規模言語モデル(LLM)が急速に発展し、さまざまな場面で活用されています。その一方で、回答生成時の計算の流れを追うことはできますが、それぞれの計算の意味は十分には明らかになっておらず、回答の信頼性向上に向けた課題となっています。本研究では、LLMの内部動作の理解を目的とし、モデルの構成要素の役割や回答生成時における指示文(プロンプト)の参照箇所の分析などに取り組んでいます。さらに、誤情報の検知や効果的なプロンプトの設計への応用も目指しています。

その他のゴールの取り組みは、研究取り組み一覧でもご覧頂けます

GOALS

大規模言語モデルの内部動作の理解