Open AI、ビッグモデルの悪意のある行動を阻止するCoT監視をリリース
Crypto 7x24
2025-03-11 08:16:44
4824
Open AIは、CoT(マインドチェーン)監視方法を使用して、ビッグモデルのナンセンス、真の意図の隠蔽などの悪意のある行動を阻止することができるという最新の研究を発表しました。Open AIは、最新リリースの最先端モデルo 3-miniを監視対象として使用し、より弱いGPT-4 oモデルを監視対象として使用しています。テスト環境は、AIが単体テストに合格するためにコードベースに機能を実装するコーディングタスクです。その結果、CoTモニタは、システム的な“報酬ハッキング”を検出する際に優れており、監視のみの60%をはるかに上回る95%のリコール率を示しました。
免責事項: この記事の見解は元の著者の見解であり、Hawk Insight の見解や立場を表すものではありません。記事の内容は参考、コミュニケーション、学習のみを目的としており、投資アドバイスを構成するものではありません。著作権上問題がある場合は削除のご連絡をお願い致します。