“堅持做基礎模型迭代的企業減少很多了” 大模型應用迫在眉睫,但“從量變到質變”仍面臨三重挑戰
無論是對應用和商業化進程的考量,還是對技術路徑本身的爭論與思考,相比於熱潮剛剛襲來之時,近期,人工智能領域的從業者似乎感受到了一絲寒意。
“相比一年前,還能夠堅持獨立自研、做基礎模型迭代的科技企業已經減少很多了。”12月26日,在“大模型技術發展與治理創新”研討會上,阿里巴巴集團安全部總裁錢磊如此表示。
不過,國內大模型之間的競爭依然還在白熱化階段。北京市網信辦副主任潘鋒在研討會上表示,當前大模型市場“百模大戰”,但真正有競爭力的模型並不是很多,不少企業還沒有找到可盈利的商業模式,面臨比較大的生存壓力。這些體現爲“重生能力”的不足。
在潘鋒看來,在對話搜索場景面臨競爭紅海的同時,自動駕駛、辦公、教育、醫療等垂直領域加速釋放潛能,還沒被充分挖掘。
大模型的應用和商業化,目前仍是一道難解的大題,不過好在機會尚多。從生成式AI到智能搜索,再到AI Agent(智能體)、AI硬件,甚至具身智能,大模型應用領域層出不窮,單拎出來都是潛力無限的“大市場”。不過,資本和市場給出的排期越來越緊湊了⋯⋯
“從量變到質變”仍面臨三重挑戰
從技術熱潮中逐步迴歸有關技術產品的應用和商業化考量,更理性看待大模型發展的進程,或許是當下各方需要做到的。雖然人工智能的研發和應用在持續推進,但大模型的發展從量變形成質變,依然挑戰重重。
潘鋒認爲,除了上述提到的“重生能力不足”,還有兩點挑戰。一是原生程度不足。大量國產模型採用國外的開源架構進行訓練,網上有一個說法,“國外一開源,國內就創新”,自主創新基礎不牢,由於國外原生創新是用國外大量的語料進行培訓,再加上國內高質量的語料和高性能的算力供給不足,導致距離國際頂尖水平還有一定差距。
二是內生安全不足。潘鋒認爲,傳統大模型安全保障主要採用安全圍欄方式,依靠過濾、打補丁等方法來限制模型的輸入輸出,沒有從訓練語料和模型架構方面真正解決內生的安全問題。因此,需要進一步研究大模型的相關機制,完善治理體系等。
針對大模型內生安全問題,錢磊以阿里的大模型舉例表示,在數據採集、處理階段強調源頭管控,進行嚴格的數據篩選和數據安全標註,在模型訓練和設計階段通過添加安全語料,設置安全任務等方式,提升模型的內生安全能力。此外,在模型上線前也會進行全面安全評估,確保各類風險項目在生成內容上的合格率。
“在模型部署應用後,通過‘外圍護欄’進一步提升大模型在應用場景中的安全性。我們會通過日常巡檢驗證結果是不是能夠達到我們的預期,是不是可靠、可信、可用。”錢磊補充說。
大模型應用迫在眉睫
“大模型研發有着比較高的技術門檻和資源門檻,相比一年前,還能夠堅持獨立自研、做基礎模型迭代的科技企業已經減少很多了。”談及市場現狀,錢磊如此表示。
針對阿里的大模型技術路徑,《每日經濟新聞》記者瞭解到,阿里主張雲和AI的協同發展,強調雲從IT(信息化)和DT(數字化)的基礎設施,向人工智能基礎設施方向演進。
對於後續投入,錢磊表示,一是會提高自研基礎模型通義系列的能力,二是會通過完善AI基礎設施和相關支撐系統,降低模型應用開發的成本。
數據顯示,過去一年,通義千問的API調用價格下降了97%。開源方面,全球開發者基於通義開源模型的二次開發衍生模型達到了7.8萬個。
對於大模型應用趨勢,中國電子技術標準化研究院大模型安全標準負責人張妍婷表示,一個是端側模型,例如無人駕駛汽車裡,端側的類腦模型可以處理大量的實時多模態傳感數據,輔助做一些比較快速的駕駛決策,從而不需要依賴雲端的算力,同時解決了實時性和隱私性問題。
另一個是具身智能。其特色就是用機器去跨越從感知到行動的邊界,進而促進通用人工智能的發展。“因爲它可以通過身體和環境動態交互獲取信息,同時結合大模型的強大能力,實現感知、推理和行動的一個閉環,爲通用人工智能提供了一種行動和感知的結合能力。”張妍婷解釋道。
今年上半年,行業就“通用大模型還是垂直大模型”展開爭論,臨近年末,有關AI、大模型產品應用層面的消息不斷。而面對市場環境的變化,加之技術產品本身進程的推移,初創公司“出圈”的窗口期越來越近,更具戰略運營能力、生態建設完善的大廠也在不斷“武裝”。
12月17日智譜官宣30億元新融資後,同爲大模型“六小虎”的階躍星辰也宣佈完成數億美元B輪融資。現階段,大家都處在籌備階段,市場也在等着一個破土而生的新應用、新產品到來。