通用AI智能體Manus突然發佈,性能趕超OpenAI!深挖AI智能體的機遇
來源:光大證券微資訊
3月6日,科技股再次成爲A股焦點,AI智能體、智譜AI、Sora、多模態AI等概念漲幅均突破5%,AI智能體推動科技股上漲。
究其原因,AI領域初創公司蝴蝶效應(BUTTERFLY EFFECT)發佈AI Agent(AI智能體)產品Manus的早期預覽版,不僅可以主動篩選簡歷,還能爲用戶規劃旅行線路並形成旅遊手冊,還可以幫助老師製作視頻來解釋複雜的物理概念。
根據OpenAI的分類,AI智能體處於第三等級,成爲邁向通用人工智能時代的關鍵環節。國內外科技巨頭都在積極發展AI Agent,這也給人工智能領域帶來了新的發展機遇。
1、國產AI智能體Manus,通用AI Agent雛形顯現
3月6日凌晨,人工智能初創公司蝴蝶效應(BUTTERFLY EFFECT)突然發佈AI Agent產品Manus的早期預覽版,功能十分強大。
在詳細介紹Manus之前,我們有必要向大家介紹一下何爲AI Agent。AI Agent是一種可以根據環境參數進行合理的決策,並執行決策的智能體,是通往AGI時代的重要鑰匙。
根據OpenAI對人工智能發展等級的劃分,AI Agent處於第三等級,成爲承上啓下的關鍵環節。
第一等級和第二等級分別是Chatbots(對話機器人)和Reasoners(推理模型),部分科技公司已經較好實現了這兩個等級,先進的推理模型綜合表現已經可以達到博士生水平。
如果把第一等級、第二等級視爲“修煉內功”階段,那麼第三等級Agents(智能體)則是AI真正開始執行復雜任務,並能做出合理的決策來實現人機協作。同時,AI Agent在大量實踐中才能帶來人工智能的能力躍升,進而升級至第四等級Innovators(創新者)和第五等級Organizations(組織者)。
通俗地說,AI Agent將成爲AI時代的“應用程序”,最終幫助用戶完成各種任務。在時長4分鐘的演示視頻中,團隊首席科學家季逸超詳細地介紹了Manus的應用案例,網友驚呼Manus工作能力極爲強大。
在篩選簡歷的案例中,Manus不僅可以解壓共有10份簡歷的壓縮文件,還可以自主瀏覽、記錄簡歷重要內容,並給出篩選結果建議和候選人的個人簡介。
更讓人稱讚的是,Manus採取雲中異步工作的方式,這就意味着用戶可以直接關閉電腦,Manus通過雲計算完成工作後便發送通知消息。
在GAIA基準測試中,Manus獲得了SOTA(State-of-the-Art)的成績,已經實現了最優性能,好於OpenAI同類產品。
2、科技巨頭持續加碼AI Agent,2025年或迎爆發元年
隨着大模型技術不斷髮展、算力基礎設施不斷增強,AI應用端迎來爆發式增長。在去年12月舉辦的ICT行業趨勢年會上,中國工程院院士鄔賀銓表示,2025年將是智能體的元年。鄔賀銓表示,端側大模型與嵌入OS的智能體相結合,便可以生產出AI手機,AI手機有望激活萬億元規模的手機和PC產業。
2024年11月,Gartner發佈了2025年十大戰略技術趨勢,在AI Agent方面,Gartner 預測,到2028年AI Agent將完成至少15%的日常工作決策。
正是看到AI Agent的重要作用,國內外科技巨頭持續在該領域發力,日前OpenAI發佈的首款AI智能體Operator也成爲焦點。
根據OpenAI官網的介紹,Operator通過自主調用瀏覽器來完成任務。Operator可以查找網頁,並完成打字、點擊、滾動頁面等操作。作爲一款AI Agent,Operator可以獨立完成工作,工作內容包括填寫表格等重複性工作,購買雜物,甚至是創建表情包。
OpenAI的Operator搭載了 Computer-Using Agent (CUA)全新模型,CUA結合了GPT-4o視覺能力和高級推理能力,進而實現了圖形用戶界面的交互。
Operator整體能力較爲強大,但和人類的表現仍有較大的差距。在使用瀏覽器測試中,CUA模型可以得到58.1%的評分,但是人類可以達到78%的評分。
早在去年10月,國內智譜AI上線了自主智能體AutoGLM。用戶只需要對手機說話,便可以實現網絡購物、訂購火車票、點外賣、發微信、搶紅包等功能,公司也已經獲得了淘寶、微信、美團等APP的授權。
智譜AI已經與國內手機廠商展開了深入的合作,其中就包括榮耀。榮耀此前發佈個人化全場景AI操作系統MagicOS 9.0,宣佈將YOYO助理升級爲智能體,具備“自然語義理解和計算機視覺”、“用戶行爲習慣學習和場景環境感知”、“意圖識別及決策能力”、“應用內及跨應用操作”四大核心能力。
與傳統智能手機相比,AI手機將在算力、軟件應用、系統、操作方式等方面進行升級,最終讓AI技術更好地服務用戶的工作與生活。
根據iFinD數據庫,A股多家上市公司已經佈局AI手機業務,包括:宏景科技、辰安科技、賽意信息、四川長虹、利歐股份、延華智能、引力傳媒、華勝天成、能科科技、浙大網新、居然智家、金財互聯、中科金財、吉大正元、神州信息、雲賽智聯、久其軟件等。
(本文首發於2025年3月6日)
本文源自:券商研報精選