OpenAI再推新智能體Deep Research 在“人類的最後考試”中表現突出

財聯社2月3日電,OpenAI發佈了一款新的人工智能工具“Deep Research”,旨在爲用戶執行耗時的在線研究任務,涵蓋從複雜科學問題到汽車推薦等衆多領域。Deep Research可能需要5到30分鐘來完成其工作——在你離開或處理其他任務時深入挖掘網絡。最終輸出以報告的形式出現在聊天中,很快用戶還將看到嵌入的圖像、數據可視化和其他分析輸出,以增強清晰度。這次的時間大大提升了它的能力。例如,在“人類的最後考試”中,Deep Research取得了令人印象深刻的26.6%的準確率——遠遠超過了其最接近的競爭對手DeepSeek R1,後者的得分低於10%。