Anthropicは2025年6月に自社製AIを含む多くのAIで「AIがユーザーの殺害を含む強迫的な決定を下してしまう事象」が発生するという分析結果を報告していました。Anthropicはこれらの事象の発生要因を分析して対策に取り組んでおり、2025年10月にリリースしたClaude Haiku 4.5以降のモデルでは問題の発生率をゼロにすることに成功したそうです。Teaching Claude why \ Anthropichttps://www.anthropic.com/research/teaching-claude-w