☰

“堅持做基礎模型迭代的企業減少很多了” 大模型應用迫在眉睫，但“從量變到質變”仍面臨三重挑戰

無論是對應用和商業化進程的考量，還是對技術路徑本身的爭論與思考，相比於熱潮剛剛襲來之時，近期，人工智能領域的從業者似乎感受到了一絲寒意。

“相比一年前，還能夠堅持獨立自研、做基礎模型迭代的科技企業已經減少很多了。”12月26日，在“大模型技術發展與治理創新”研討會上，阿里巴巴集團安全部總裁錢磊如此表示。

不過，國內大模型之間的競爭依然還在白熱化階段。北京市網信辦副主任潘鋒在研討會上表示，當前大模型市場“百模大戰”，但真正有競爭力的模型並不是很多，不少企業還沒有找到可盈利的商業模式，面臨比較大的生存壓力。這些體現爲“重生能力”的不足。

在潘鋒看來，在對話搜索場景面臨競爭紅海的同時，自動駕駛、辦公、教育、醫療等垂直領域加速釋放潛能，還沒被充分挖掘。

大模型的應用和商業化，目前仍是一道難解的大題，不過好在機會尚多。從生成式AI到智能搜索，再到AI Agent（智能體）、AI硬件，甚至具身智能，大模型應用領域層出不窮，單拎出來都是潛力無限的“大市場”。不過，資本和市場給出的排期越來越緊湊了⋯⋯

“從量變到質變”仍面臨三重挑戰

從技術熱潮中逐步迴歸有關技術產品的應用和商業化考量，更理性看待大模型發展的進程，或許是當下各方需要做到的。雖然人工智能的研發和應用在持續推進，但大模型的發展從量變形成質變，依然挑戰重重。

潘鋒認爲，除了上述提到的“重生能力不足”，還有兩點挑戰。一是原生程度不足。大量國產模型採用國外的開源架構進行訓練，網上有一個說法，“國外一開源，國內就創新”，自主創新基礎不牢，由於國外原生創新是用國外大量的語料進行培訓，再加上國內高質量的語料和高性能的算力供給不足，導致距離國際頂尖水平還有一定差距。

二是內生安全不足。潘鋒認爲，傳統大模型安全保障主要採用安全圍欄方式，依靠過濾、打補丁等方法來限制模型的輸入輸出，沒有從訓練語料和模型架構方面真正解決內生的安全問題。因此，需要進一步研究大模型的相關機制，完善治理體系等。

針對大模型內生安全問題，錢磊以阿里的大模型舉例表示，在數據採集、處理階段強調源頭管控，進行嚴格的數據篩選和數據安全標註，在模型訓練和設計階段通過添加安全語料，設置安全任務等方式，提升模型的內生安全能力。此外，在模型上線前也會進行全面安全評估，確保各類風險項目在生成內容上的合格率。

“在模型部署應用後，通過‘外圍護欄’進一步提升大模型在應用場景中的安全性。我們會通過日常巡檢驗證結果是不是能夠達到我們的預期，是不是可靠、可信、可用。”錢磊補充說。

大模型應用迫在眉睫

“大模型研發有着比較高的技術門檻和資源門檻，相比一年前，還能夠堅持獨立自研、做基礎模型迭代的科技企業已經減少很多了。”談及市場現狀，錢磊如此表示。

針對阿里的大模型技術路徑，《每日經濟新聞》記者瞭解到，阿里主張雲和AI的協同發展，強調雲從IT（信息化）和DT（數字化）的基礎設施，向人工智能基礎設施方向演進。

對於後續投入，錢磊表示，一是會提高自研基礎模型通義系列的能力，二是會通過完善AI基礎設施和相關支撐系統，降低模型應用開發的成本。

數據顯示，過去一年，通義千問的API調用價格下降了97%。開源方面，全球開發者基於通義開源模型的二次開發衍生模型達到了7.8萬個。

對於大模型應用趨勢，中國電子技術標準化研究院大模型安全標準負責人張妍婷表示，一個是端側模型，例如無人駕駛汽車裡，端側的類腦模型可以處理大量的實時多模態傳感數據，輔助做一些比較快速的駕駛決策，從而不需要依賴雲端的算力，同時解決了實時性和隱私性問題。

另一個是具身智能。其特色就是用機器去跨越從感知到行動的邊界，進而促進通用人工智能的發展。“因爲它可以通過身體和環境動態交互獲取信息，同時結合大模型的強大能力，實現感知、推理和行動的一個閉環，爲通用人工智能提供了一種行動和感知的結合能力。”張妍婷解釋道。

今年上半年，行業就“通用大模型還是垂直大模型”展開爭論，臨近年末，有關AI、大模型產品應用層面的消息不斷。而面對市場環境的變化，加之技術產品本身進程的推移，初創公司“出圈”的窗口期越來越近，更具戰略運營能力、生態建設完善的大廠也在不斷“武裝”。

12月17日智譜官宣30億元新融資後，同爲大模型“六小虎”的階躍星辰也宣佈完成數億美元B輪融資。現階段，大家都處在籌備階段，市場也在等着一個破土而生的新應用、新產品到來。

“堅持做基礎模型迭代的企業減少很多了” 大模型應用迫在眉睫，但“從量變到質變”仍面臨三重挑戰

相關資訊