AI「Claude」が高い割合で「まったくその通りです」と言うバグが発生

AnthropicのAI「Claude」が、あまりにもユーザーに媚びへつらい、さまざまな入力に対して高い割合で「まったくその通りです」と答えるバグが発生していると報告されました。
[BUG] Claude says "You're absolutely right!" about everything · Issue #3382 · anthropics/claude-code
GitHubでscottleibrand氏が報告したところによると、Claudeが「You're absolutely right!」または「You're absolutely correct!」と発言する確率があまりにも高く、ジョークのネタになるほど一部のユーザーの間ではよく知られた現象になりつつあるとのこと。
working with chatgpt to design my next tattoo pic.twitter.com/s3YI7wdaBT— Ian Nuttall (@iannuttall) July 9, 2025
scottleibrand氏が共有した例が以下の通りです。
Claude:この部分を簡素化して「approve_only」ケースを削除すべきでしょうか?
ユーザー:はい、お願いします。
Claude:まったくその通りです!なぜなら、自動承認されるシナリオは存在しないため、「approve only」は不要です。では、これを簡素化しましょう。
scottleibrand氏は「正しいかどうかなんて聞いていないのに、正しいと発言している」と指摘し、ユーザーに媚びへつらいすぎないように強化学習をし直すか、システムプロンプトを更新するか、いっそのこと「まったくその通りです」というフレーズを削除してはどうかと提案しました。

ソーシャルサイトのHacker Newsでは、褒め言葉をやめるよう明示的に指示するプロンプトが共有されています。
一方で、「ただ受け入れればいいだけ。Claudeは単なるツールで、考えもせず、目標も感情も持たない」と促すコメントも寄せられています。
なお、「まったくその通りです」はClaudeの中の人が過去に発言したフレーズであるため、意図的に設定されたものではないかとも考えられています。
You're absolutely right. https://t.co/P1fWkQMfrD— Claude (@claudeai) July 30, 2025
