對話宇樹科技創始人王興興:人形機器人大模型,還沒走到“大力出奇跡”階段
隨着人形機器人逐漸成爲創投領域的熱門賽道,宇樹科技也越來越多地受到市場關注。
這家成立於2016年的公司,起步階段是專注於四足機器人的開發。2023年初,宇樹科技立項人形機器人產品,並在同年推出了首款通用人形機器人產品宇樹H1。2024年2月,宇樹科技完成了近10億元B2輪融資,美團成爲該公司的最大股東。
8月21日,世界機器人大會期間,宇樹科技發佈了人形機器人G1的量產版本,起售價爲9.9萬元,這是雙足人形機器人價格首次下調至10萬元以內。宇樹科技方面稱,G1人形機器人,身高約127釐米,體重約35公斤,小跑速度超過2m/s ,擁有23至43個關節,可執行如動態站起、坐下摺疊、舞棍等動作。
“宇樹科技入局人形機器人賽道,基本上是遵循順勢而爲的邏輯。如果做的太早或太晚,其實都是不好的。”
宇樹科技創始人王興興表示,大語言模型出來以後,AI的技術產生了質變,大家已經看到AI賦能機器人帶來的潛力。對於人形機器人而言,基本就是四足機器人站起來的另一個版本。
王興興認爲,在過去的一到兩年內,國內很多人形機器人公司之所以可以跑出來,是因爲大家用了大量開源的四足機器人技術,包括控制算法、硬件等。但是,人形機器人想要繼續發展,單純靠大語言模型還遠遠不夠。大語言模型本身是機器人模型的一部分,但它不是全部。
從ChatGPT的技術邏輯也可以看到,大語言模型找尋到了一條“大力出奇跡”的可行性路徑。OpenAI通過不斷地增加算力和數據,ChatGPT的人機交互能力就可以不斷上升,而且目前業界還沒有看到這種能力提升的“天花板”。但對於機器人大模型而言,王興興認爲目前這個行業沒有走到“大力出奇跡”的階段。
“目前國內的大公司其實對AI和機器人都挺關注的,但他們的投入也是比較剋制的。”
王興興對鈦媒體APP表示,大公司和創業公司對於機器人大模型投入比較剋制的最大原因就是,機器人模型的技術路線沒有像大語言模型那麼清晰。“在這模型研發沒有清晰路線的階段,如果投入大的財力和人力,其實會有點使不上勁的感覺。這條路你都不太清楚,你拼命往裡面跑也跑不了。”
王興興稱,在人形機器人領域,通過增加算力和數據可以提升機器人某一方面的能力。機器人通用的AI模型,全球範圍內大家做得都不夠好,目前沒有人可以真正將AI機器人做到極致。“全球都沒有人做出來的情況下,你可以認爲這件事情需要靠運氣,或者看某個天才式的人物來推動了。”
以下是王興興與包括鈦媒體APP在內的交流內容,略經編輯:
從目前人形機器人研發的角度看,大模型可解決哪些技術問題?主要應用在哪些方向?大模型和人工智能的應用有望降低研發成本嗎?
王興興:大家說大模型的時候,一般是在說大語言模型或者多模態模型,這部分肯定是可以給機器人用的。但真正的機器人大模型發展下去,單純的大語言模型還是不夠的。大語言模型本身是機器人模型的一部分,但它不是全部。
舉個最直觀的例子,比如在工廠裡做事的一個機器人,他完全可以不說話,他只要能幹活就行了。而對於幹活這個點的話,這部分的訓練其實跟大語言模型沒多大關係,更多的是一些模仿學習。而且這個模型結構跟大語言模型結構也會偏差比較大,目前整個體系沒有那麼成熟,不像大語言模型整個的風格結構、數據對齊那樣清晰的。
在ChatGPT模型出來以前有非常多的語言模型結構,但大家現在已經忘了,因爲後來大家發現GPT模型的架構是更加有價值的,就把其他模型淘汰了。現在人形機器人具身智能有點像ChatGPT出來前的一兩年,大家已經發現了要往這個方向做,但實際上沒有哪家敢保票,說我這個方向是絕對正確的。
今年國內很多外人形機器人公司都宣佈“進廠打工”,您怎麼看這個現象?宇樹科技的人形機器人的落地現狀和未來規劃是怎樣的?
王興興:這是一個趨勢。我們過去幾個月也跟蔚來的汽車工廠有合作,現場部署了人形機器人去做搬運,包括國內別的一些人形機器人也跟汽車工廠有些合作。這個目前基本上還是處於試點階段,還沒有到真正的商業閉環,比如一臺機器人它產生的商業價值是正向的,比人工更便宜。
目前宇樹科技的四足機器人營收佔比是怎樣的?人形機器人的快速發展,對於四足機器人來說是機遇還是挑戰?
王興興:目前消費端產品可能佔了整個機器狗營收的1/3。
大家可能一直覺得我們做了人形機器人,會不會四足機器人顧不過來。但實際上,我們四足和人形機器人的兩個業務,很多人員是共用的,因爲兩個領域的硬件、電控系統、軟件、OTA升級平臺和AI算法等共用的地方非常多。
通用人形機器人領域什麼時候會出現一個iPhone時刻?AI大模型爲機器人領域帶來了哪些明顯的能力的提升,還存在哪些挑戰?
王興興:人形機器人離iPhone時刻還有很大距離。iPhone的出現,並不是說有一個特別技術突破了,更多是一個綜合性的技術突破。比如說原本已經有觸摸屏了,有很好的CPU,或者還有一些圖形界面。然後,喬布斯把終極產品的構想給提出來了,把這些技術都整合在一起。
在具身智能或者機器人AI這個領域,我覺得在今年年底之前,至少全球有一家公司或有個實驗室能把通用型的機器人AI模型給做出來。但這也不是iPhone時刻,因爲iPhone時刻標誌着這個行業的出貨量暴增。人形機器人真正的iPhone時刻會更遠一點,但是我覺得不會超過5年。
您之前提到過會考慮在機器人上面增加足夠多的觸覺感知,你認爲現在觸覺的重要性在哪裡以及瓶頸又是什麼?
王興興:我一直覺得觸覺是非常重要的一件事情。
對於一個人來說,假設你全身皮膚的觸覺喪失了,你可能抓一個東西都抓不住。再比如,如果你貼一張膠帶在貓的身體上,這個貓會發生很奇怪的動作。觸覺對整個哺乳動物來說,都是非常重要的一件事情。
但是,目前人形機器人觸覺的進展確實非常糟糕,機械臂上基本沒有觸覺傳感器。原因也比較簡單,觸覺傳感器非常不好做,因爲它要非常小且足夠的敏感,但敏感和可靠性天然存在矛盾。一個非常敏感的傳感器,就意味着非常容易壞,一旦受到碰撞,就會導致操作變形。
在您看來目前人形機器人發展最大的瓶頸是什麼?
王興興:當下的所有機器人最大的瓶頸,還是基層AI的能力在全球範圍內都沒有達到一個像初代GPT或者初代通用AI的能力。
目前雙臂機器人或者一個工業機器人,如果加了AI以後,它產生的人效比人低,比如速度比較慢,精度比較差,能幹的活比較少,它其實很難替代工業上面人的價值,這樣的話整個的商業閉環沒辦法跑通。
另外,當然目前可能硬件還是有些問題,比如硬件的機械臂的負載能力不夠,精度不太夠,成本有點高,但實際上這只是工程上的問題。如果現在機器人AI哪家公司能做一個突破,我們年底前就可以直接量產10萬個機器人。
您如何看待現在智能機器人的行業的競爭格局?您覺得中小公司的機會在哪?
王興興:中小公司目前最大的點,就是你得對前沿技術保持足夠高的敏感度,你得看到未來,你得足夠靈活。如果能預估未來1年2年,甚至是5年以後的整個技術路線,整個產品格局,你提前做佈局,能不能做第一不太清楚,但你肯定死不了。
對於大公司而言,要做到這一點比較難。大公司內部的流程,內部團隊的相互競爭,然後資源和溝通的順暢性都不如中小公司。
另外,我們一直非常關注商業化。我們做人形機器人最主要也是我們衝着商業化去的,有客戶我們纔去做的這個方向。目前我們的人形機器人客戶比較雜,有個人的、科研教育的、AI公司的、科技公司的,還有一些工廠的項目落地等。我們基本的策略還是希望給大家提供本體,無論是個人買來玩也好,工廠裡面做一些應用也好,或者學校做一些研究,我們都完全歡迎。
現在機器人都還在投入期,您有沒有預估它什麼時候能到盈虧平衡,然後什麼時候能到一個市場爆發的時候?
王興興:盈虧平衡具體要看怎麼算了。其實我們公司還是保留了合理的利潤,相對來說最大的點還是希望有更多的機器人出貨量,有更多的人能使用機器人,這可能是更重要的。
還有一點,如果你投入大量的AI與人力,你可能很難盈虧平衡或者虧損會比較嚴重,因爲AI太費人了,燒錢也會比較嚴重一點,因爲算力比較貴。其實每家公司不太一樣,如果你AI投入少,可能就比較容易實現盈虧平衡,你如果AI投入大可能就很難實現。
所以,在人形機器人領域是不是不太存在“大力出奇跡”的可能性?
王興興:情況是這樣的。
如果一家大公司有財力和人力,我還是建議他可以多投入一點的。但是對我們這樣的創業公司,可能就不太合適,我們還是比較保守一點。因爲機器人的AI模型,其實不像大語言模型的技術路線沒有那麼清晰。
所以,在這個模型沒有清晰的階段,你如果投入大的財力和人力,其實你有點使不上勁的感覺。就是這條路你都不太清楚,然後你拼命往裡面跑,你也跑不了,對吧?
OpenAI當時投入大量精力去做ChatGPT的提前是,他們內部已經驗證了模型是ok的。他們做了一個ChatGPT模型出來,然後給他餵了不少的算力和資源,發現效果其實非常明顯,然後再繼續加算力和資源發現效果依然很明顯。而不是,他們在模型還不太清楚的時候就亂投入。
大家如果去看一下OpenAI早期的發展經歷,可以看到他早期幾年做的事情很雜,機器人的AI模型他們也做過。後來他們發現GPT這個模型可以大力出奇跡以後,把資源都給彙總起來,專門做GPT。
但現在像機器人這個領域,目前你要說哪個方向特別正確,還比較難判斷。目前相對公認的是,特斯拉要搞的就是這個方向,通過堆數據是有效果的。不過,堆數據也只是針對單個的細分場景,更大範圍的驗證效果如何,目前還不太確定。(本文首發於鈦媒體APP, 作者 | 饒翔宇 編輯 | 鍾毅)