AIモデルの思考を言葉に翻訳する「自然言語オートエンコーダー」をAnthropicが発表

2026年5月8日 13時10分

ClaudeのようなAIモデルは内部的に単語を処理するとき、思考を符号化した長い数字の列「活性化値」として扱っており、解読するのは難解です。Anthropicは長年、活性化値を理解するために様々なツールを開発しており、新たに人間が読める自然言語に翻訳する「自然言語オートエンコーダー(Natural Language Autoencoders：NLAs)」を発表しました。Natural Language Autoencoders \ Anthropichttps://www.anthropic.com/research/natu

記事を読む

ランキング