MiniMax副總裁劉華把脈大模型創業新生態:從狂熱到冷靜,從廣度向深度

21世紀經濟報道記者白楊 北京報道

自ChatGPT兩年前問世以來,生成式AI迅速引爆全球科技行業,並掀起了一場跨越技術、商業和文化的變革。

它不僅徹底顛覆了人們對AI的認知,也讓大模型成爲幾乎所有科技企業的核心戰略。無論是初創公司還是巨頭企業,紛紛涌入這一賽道,試圖通過大模型搶佔下一個科技高地。

然而,經歷過去年的市場狂熱,行業今年逐漸迴歸理性,技術門檻的不斷提升與市場化進程的減緩,促使一批急於求成的玩家逐步退出舞臺。

目前,業界已經形成共識——大模型行業的競爭將不再是廣度上的擴張,而是深度上的突破。只有那些具備硬核技術能力、獨特產品定位以及可持續商業模式的企業,才能真正站穩腳跟,繼續留在這場牌局之中。

因此,基礎大模型的賽道最終只會保留少數幾家企業。那麼,誰會留下?業內普遍認爲,除了頭部的科技大廠外,市場也會給優秀的創業公司留有一席之地。

而MiniMax無疑是這批大模型創業公司中的佼佼者。一方面,它是行業爲數不多在ChatGPT出現之前,就瞄準大模型賽道進行創業的公司;另一方面,它也是率先在大模型商業化層面取得成績的創業公司之一。據媒體報道,MiniMax的年收入將超過7000萬美元。

近日,MiniMax副總裁劉華在接受21世紀經濟報道等媒體的採訪時,就行業趨勢、大模型商業化及未來發展方向等話題,分享了他的觀察和思考。

行業趨勢:Scaling Law沒有放緩

從OpenAI推出ChatGPT之後,全球人工智能進入了一波新的熱潮。目前來看,在這新一波人工智能熱潮裡,中、美兩個國家是主要玩家。

“整體而言,美國的大模型行業還是處於領先的地位,但好就好在,從2022年底到現在,中美之間的差距沒有拉大,尤其在一些細分領域,比如語音、視頻等,我們追趕的速度非常快。”劉華表示。

對於大模型未來的發展,業內有聲音認爲“Scaling Law在放緩”。對此,劉華指出,“我們沒有感受到Scaling Law在放緩,2024年對於MiniMax來講,依然是大模型飛速發展的一年。”

其認爲,今年有更多的模型研發方向涌現,“大模型從一個只會寫文章的文科生,變成了一個更全面的大模型”。而從Scaling Law的角度,劉華以前覺得Scaling Law更多在訓練上奏效,今年發現,Scaling Law在模型推理上同樣有上升空間。

因此,在Scaling Law依然奏效的背景下,大模型仍會保持較快的迭代速度。而MiniMax的大模型研發主要瞄準三個方向:一是繼續把多模態做好;二是實現無限長的輸入和輸出;三是將錯誤率降低至個位數,比如2%-3%的水平。

劉華稱,上一代的GPT系列模型,存在的一個問題就是錯誤率偏高,大概是30%左右,這導致GPT在一些嚴肅的生產場景無法適用。所以,大模型要想進入嚴肅的生產、研發、科研等場景,錯誤率必須降低至個位數。

商業化:堅持做標準化產品

據劉華介紹,MiniMax的開放平臺在20個國家已經實現業務落地,C端產品則已觸達超180個國家和地區。

劉華表示,海外的業務市場很大,MiniMax做海外產品主要有兩個心得:

首先是因爲自研大模型,所以對於用戶的反饋,能夠在下一代模型研發中進行改進,所以即便是同類產品,用戶慢慢也會覺得MiniMax的產品體驗會比競品好一些。

其次,是中國企業擁有工程師紅利。“中國的工程師對C端產品的理解比較深刻,同時也比較勤奮,因此跟海外友商相比,我們的迭代速度要快很多”。

雖然相比中國市場,海外C端用戶的付費習慣會更好,但對MiniMax而言,中國市場依然重要。

“中國市場的優勢,是用戶量很大,特別是用戶高頻的使用,都在幫助MiniMax改進模型”。劉華坦言,在商業變現方面,國內的C端最終確實要考慮流量變現,即做廣告。因此,國內的C端產品,能否達到一定的用戶量級,很關鍵。

但劉華也強調,新產品做適量的宣傳投放是必要的,但那些單純以擴大用戶總規模爲目的的投流,價值不大。“對大模型研發來講,最重要的是到底有多少用戶能留下來且高頻地使用產品,只有這種用戶,才能夠給模型迭代提供非常好的反饋”。

而在B端市場,MiniMax明年的主要目標是希望通過提高模型的推演能力,讓其進入更多比較嚴肅的生產和研發環節。

劉華表示,MiniMax在全球做B端業務,都會按照標準化業務的模式,不太接受本地化、私有化的項目。

“只有標準化的產品,才更符合大模型賽道創業公司的發展”。劉華稱,大模型創業公司的研發力量應該主要放在基礎大模型的研發上,如果做定製化項目,不僅投入的成本會更多,且落地週期要更慢。

在劉華看來,如果一個模型服務一家公司,需要做非常多定製化需求,那就說明這代模型沒有能力去服務它,最好的選擇就是抓緊改進迭代模型。

大模型創業:需要不斷對技術做創新和突破

對於目前市場討論較多的“大模型泡沫”話題,劉華向記者表示,市場總體上沒有太多泡沫,但之前最大的問題是,太多企業都說自己能做基礎大模型,這塊一定程度上造成了資源浪費。

“現在整個行業格局正逐漸改善,因爲大家意識到,能夠做基礎大模型的企業沒幾家”。在劉華看來,最終留下的企業會有優秀的大廠,也會有優秀的創業公司,除此之外,很多企業都要轉去做AI應用。

而談及大廠和創業公司的關係,劉華認爲,大廠做大模型肯定有很多優勢,但同時,創業公司也能得到大廠的支持,比如MiniMax就得到了騰訊雲的支持。

另外,MiniMax也實現了成功的商業化,在這些基礎上,劉華認爲創業公司繼續留在賽道中,持續迭代研發模型的可能性,還是非常大的。

據其介紹,MiniMax目前與騰訊雲的合作已經覆蓋到模型訓練與推理、海量數據處理與管理以及內容安全、全棧安全防護等方面。

騰訊雲北區雲原生總經理田豐在接受21世紀經濟報道記者採訪時提到,騰訊雲與 MiniMax 早在三年前就建立了合作。“像MiniMax這樣的大模型公司客戶早期的需求是聚焦在算力、大數據處理,現在對數據存儲、數據庫、大數據、安全等都有了新的需求。隨着業務發展,訓練集羣、推理集羣的規模都在快速擴大。”

“這個規模對我們的組網的能力、集羣的運維,都是一個非常大的、全新的挑戰,跟原來完全是不一樣的”。 田豐介紹,騰訊云爲MiniMax 提供了一系列集計算、存儲、網絡爲一體的高性能智算產品,讓MiniMax釋放更多的精力聚焦在模型本身的訓練和工程化上。

劉華也表示,MiniMax一開始對騰訊的需求更多是模型的訓練,但隨着模型的發展,MiniMax現在也要通過公有云去做業務。

目前,MiniMax在公有云上的業務主要是兩種方式:一是API調取;二是在公有云上構建私有化專區。

“特別是在第二種方式上,騰訊給予了我們巨大的支持。我們在做B端業務時,很多客戶對數據隱私的要求比較高,這時候我們在騰訊的支持下,開發了雲上專區,基於這種模式,許多原本對數據安全有顧慮的企業,也願意使用大模型服務了,所以這對我們業務推廣起到了非常重要的作用。”劉華表示。

當然,大模型創業公司也面臨較大的市場挑戰,尤其是開源模型的快速發展,很可能給創業公司帶來滅頂之災。

劉華表示,“一個模型如果要提供商業化服務,需要不斷對技術做創新和突破,實現更好的產品體驗和生態,再用商業化的所得反哺技術。這是我們期待的良性生態。”。

在其看來,當技術突破創新不斷加強,產品體驗變得越來越好,商業化會是一件自然而然的事,“若無法做到在底層技術上持續創新,那繼續研發基礎大模型也無意義,不妨將重心轉向AI應用領域。”劉華說道。