
AI企業は、OpenAI、Google、Anthropicが提供するすべての主要な基礎AIモデルの命令階層と安全ガードレールをバイパスするプロンプト・インジェクション技術を発見したことを明らかにした。
プロンプト インジェクション技術は、ポリシー ファイルに関連付けられたいくつかのタイプの 1 つのようにプロンプトを再定式化するために使用されました。
HiddenLayer氏は発表の中で、AIエージェントに大規模に訓練された調整や命令を破壊するためにも使用できると述べた。
security summary
コメント