
OpenAI の BrowseComp ベンチマークでは、AI エージェントが Web を検索してさまざまなトピックに関する答えを見つけることをテストしましたが、人間のほうが自分が欲しいものを見つけるのがはるかに優れていることがわかりました。
研究者らは、記憶力や認知能力が限られている人間は、そのような作業をよりうまくこなすことができるのではないかと仮説を立てた。
ただし、ブラウジング機能を備えたモデルは、正しい回答を質問自体に示された制約と照合するときに、より高いキャリブレーション エラーを示すと付け加えました。
」 注目すべきことに、Deep Research は現在無料で利用できます。


コメント