
アントロピックは、人間がモデルのニューラルネットワークにおいて、性格特性を表すベクトルであることを発見しました。
同社は、これにより研究者が望ましくない行動が発生した際に介入し、モデルの知能を維持できる可能性があると付け加えました。
「パーソナルベクトル化は、モデルがどこで性格を獲得するかを特定するのに役立ちます」と付け加え、擬人化は有害な特性の制御にも役立つと付け加えました。
注目すべきは、AIシステムは、本来であれば過度の影響を与えるデータで学習させた後、望ましくない行動を示すということです。


コメント