OpenAIが人間を使わずAIの安全性を高める手法「Rule-Based Rewards(RBR)」を開発

2024年7月25日 13時0分

ChatGPTやGPT-4などを開発するOpenAIが、言語モデルの安全性と有効性を高めるための新たなアプローチである「Rule-Based Rewards(RBR)」を開発しました。RBRは、AI自体を使用することで人間によるデータ収集を必要とせずに、AIを安全に動作させることができるとされています。Improving Model Safety Behavior with Rule-Based Rewards | OpenAIhttps://openai.com/index/improving-model-safety-behavior-with-rule-based-rewards

記事を読む

ランキング