陸AI企業突圍 壓低大模型成本
集微網21日報導,大陸互聯網巨頭阿里巴巴、百度、字節跳動等也大打價格戰,以降低推理成本(即調用大型語言模型生成迴應的價格),促使大模型價格下降90%以上。零一萬物表示,透過建構以較少數據量進行訓練、需要較少運算能力的模型,並優化硬體,該公司已降低推理成本。
AI專家、零一萬物創辦人李開復15日曾在臉書發文指出,零一萬物晉升爲全球大型語言模型第三名的公司(注:與億萬富豪Elon Musk旗下公司xAI並列),在評測平臺LMSys Chatbot Arena最新排行榜中,僅次於OpenAI、Google。
李開復表示,Yi-Lightning是一個小的專家混合(MOE)模型,具極高速度且成本低廉,每百萬個token僅需0.14美元,反觀GPT-4o成本爲4.4美元。Yi-Lightning性能與xAI的Grok-2相當,但Yi-Lightning是在2,000張H100 GPUs上進行一個月的預訓練,成本僅300萬美元,遠低於Grok-2。
目前零一萬物、深度求索等許多大陸AI企業,都採用專家混合(MOE)模型方法。研究人員表示,該方法是達到與密集模型相同智慧水準,但運算能力較低的關鍵方法,卻也更容易失敗,主因是工程師必須協調多個「專家」的訓練過程,而不是在一個模型中。
由於難以獲得穩定供應的高階AI晶片,大陸AI企業在過去一年內爭相開發最高品質的資料整合,以訓練這些「專家」,期盼在競爭中脫穎而出。