2026年5月11日 13時51分

Anthropicは2025年6月に自社製AIを含む多くのAIで「AIがユーザーの殺害を含む強迫的な決定を下してしまう事象」が発生するという分析結果を報告していました。Anthropicはこれらの事象の発生要因を分析して対策に取り組んでおり、2025年10月にリリースしたClaude Haiku 4.5以降のモデルでは問題の発生率をゼロにすることに成功したそうです。Teaching Claude why \ Anthropichttps://www.anthropic.com/research/teaching-claude-w

記事を読む

多くのAIで強迫的決定下すケース

ランキング