ChatGPTやGPT-4などを開発するOpenAIが、言語モデルの安全性と有効性を高めるための新たなアプローチである「Rule-Based Rewards(RBR)」を開発しました。RBRは、AI自体を使用することで人間によるデータ収集を必要とせずに、AIを安全に動作させることができるとされています。Improving Model Safety Behavior with Rule-Based Rewards | OpenAIhttps://openai.com/index/improving-model-safety-behavior-with-rule-based-rewards