ChatGPTのような大規模言語モデル(LLM)は、動作の仕組みが分かりにくいことから「ブラックボックス」と呼ばれることが多く、AIの危険性や予測の困難さを唱える議論に拍車をかけています。LLMの理解を進めるため、OpenAIがLLMを用いてLLMの機能を解明するツールを公開しました。Language models can explain neurons in language modelshttps://openai.com/research/language-models-can-explain-neurons-in-language-modelsOpenAI