清華姚班如何培養天才:給最有挑戰性的問題和足夠的自由度

"清華學堂計算機科學實驗班"(簡稱"姚班")是由世界著名的計算機科學家、2000年圖靈獎得主姚期智院士於2005年發起的拔尖創新人才培養項目。進入姚班的本科生需要經過嚴格的選拔,由姚先生親自制定培養計劃。

在過去的20年中,姚班培養了衆多人工智能領域的領軍人物,包括小馬智行的聯合創始人樓天城、曠視科技的聯合創始人唐文斌、印奇和楊沐等。此外,近期備受矚目的大型AI模型公司"月之暗面"的創始人楊植麟,也曾擔任姚班的授課教師。

姚班還培養出了許多傑出的AI學者,他們現在在斯坦福大學、普林斯頓大學、杜克大學以及清華大學等國內外知名高校擔任教職。

我們有幸邀請到了清華大學交叉信息研究院的助理教授吳翼。吳老師是2010年姚班的畢業生,並選擇回到母校繼續任教。

吳老師和我們分享了他在姚班求學和任教的經歷。比如姚班高難度的課程設置是要“把最優秀的人聚集起來給他們最難的挑戰。”同時給予學生的高度自由,大三就可以有足夠的時間去申請心儀的項目和實習機會。

姚期智先生會定期跟學生一對一溝通,既幽默又接地氣的指導他們:“聽不懂的講座也去聽,可以培養科學家氣質。”在和這樣一批極致天才同學和老師的相處中,吳翼獲得的感悟:“人跟人的智商差別有時候真的比人跟動物的差別還大...天天焦慮的人是撐不到十年的。”

吳老師還與我們分享姚班當前的研究方向,以及探討姚班這種"精英教育"模式是否具有可複製性:“我們現在想幫助學生給到足夠的空間和壓力,同時引導他們往天上看。人才是培養和選拔,但是沒法被計劃。”

以下是部分訪談精選:

01 “姚班”人才的選拔與培養

《硅谷101》:先請吳老師簡單介紹一下自己。

吳翼:我是2010年到2014年的時候在姚班讀本科,2014年到2019年在伯克利讀PhD。2019年的2月份一直到2020年的7月份在OpenAI工作。2020年8月份就回到清華姚班當老師了。

《硅谷101》:在你上學期間,你認爲姚班的學習方法和學習體驗有何特別之處?有哪些讓您印象深刻的地方?

我們知道清華姚班分爲兩類學生,一類是競賽類的學生,可以說是海選出來的天才中的天才;另一類是從清華其他本科班級中選拔出來的一些非常優秀的人。我很好奇他們是如何培養出這樣一羣極爲優秀的人的。

吳翼:姚班其實是分階段的。我上學的時候姚班大概是30個人,只有一個班。現在其實挺多了,有七八十個人,也有不同的方向,我覺得姚班基本上分三個階段:

第一個階段就是姚先生剛回來的時候,也就是2005年,第一次開始搞一個實驗班,當時是受姚先生個人風格影響特別強烈的一個階段。2004年第一屆姚班的學生樓天城,現在 Pony.ai的創始人。樓教主就是當時四字班,他們那個年代的姚班就是以理論計算機科學爲主。這也是姚先生自己的老本行。

當時有一個客觀的原因:姚先生覺得理論計算機科學是整個計算機科學的基礎,但是在國內沒有好的理論計算機培養體系和課程。所以當時姚先生回來,專門以理論計算機科學爲中心設計了一套培養方案。

基本上是到了2010年左右,姚班也運行了一段時間,開始有新的老師回來。比如我們院的徐葳老師也是伯克利畢業的、黃隆波老師、李建老師,這些都是我在讀書的時候從海外回來的。

從那個時代之後,我們院開始有比較廣泛的課程設置,整個院基本上,我認爲和美國的一流高校接軌了。課程體系也好,培養體系也好,都非常前沿和全面了。

不變的事情是:第一,姚班非常重視理論,就是計算機理論,所以確實有不少的理論課。

第二件事情是姚班的課程確實非常難。我們那個時候理論課就非常多,非常重,難度非常大。現在因爲他們的課程比較多,每一門課都是海外回來的老師新開的,所以難度也非常大。

第三是姚班學生確實培養的自由度非常大。舉個例子,比如我們讀書的時候,我們總體要求的學分或者學時數量比起其他院系是少的,客觀上說是少的。

《硅谷101》:是指課程少嗎?

吳翼:課時少。就比如學分是一樣的,但是我們需要坐在課堂裡面上課的時間會比別的學生少一點。但這個也是因爲我們課程難,所以就認爲你課後需要花費更多的時間。所以就把一些學時放在了課後。

所以我們需要在課堂上坐在那的時間是比較少的。或者說,我們必須要分配一些非自主安排的時間,是比別的院系要少的,並且更靈活。這就導致我們院的學生有更多的自主支配時間,可以自己做科研,實習,還可以去訪問。

其實2010年左右,當時最好的科研的機構是微軟亞洲研究院。當時中國沒有那麼好的AI研究機構,所以想做AI的話,需要去微軟亞洲研究院。但是去實習需要花時間的,大部分的院系其實是不可能抽出時間去實習。

但我們院是如果把課程排好,是真的可以做到一週有2到3天時間是沒課的。比如說我們院現在基本上能夠做到大三的一個學期可以不排課,他們就會選擇出去實習,或者去美國訪問。

這些事情院裡面都是非常鼓勵的。當然它是有個發展流程的,但是總體上姚先生是能夠做到重視理論培養,然後課程方面給大家足夠的空間。

我想說的是,這些人其實不是培養出來的,而是“智能的涌現”。其實姚班也比較像“涌現”,這些人他們做的研究,也不是院裡面老師帶的,現在我們班裡有很多做教授的同學,他們做的研究也不是跟院裡面的老師特別相關。

但是沒有關係,你只有讓他們知道世界是這麼大,然後把很多好的人攢在一起,你再給他們點時間,人才就會自動地涌現出來。所以姚先生做的事情就是把這些最好的人聚集起來,之後給他們時間和空間,並且告訴他們這個世界上有很難的問題,然後大家就會自己探索。所以有的時候也會說姚班比較卷。

《硅谷101》:感覺是把全中國最聰明的一羣人,首先先聚集起來,給他們足夠有挑戰的問題,再讓他們有足夠的自由度去探索。

我今天還看了一個姚先生的訪問。裡面有一段話是說:如果有一門課,你拿到的分數並不高,至少你知道你以後的事業就可以不用選這個方向了。所以他其實是一個非常鼓勵大家去找到自己擅長跟熱愛的一個學者。

吳翼:挺有意思的,姚先生自己本身也是挺風趣很幽默的。而且姚先生也是大家,他講的很多話其實挺深刻的。有些話是我讀書的時候其實不覺得,但回頭看,會發現他講的話是很深刻的。但這個深刻我可能在讀書的時候也不一定知道。他其實也會講一些玩笑話。當時我們院會經常組織一些講座,我們院的講座密度是非常高的,也會鼓勵本科生去聽講座。

我們那個年代姚先生還會每年請我們吃一次飯,和我們做一對一溝通。我們會問他:姚先生您講的內容都是前沿內容,我們聽不懂怎麼辦?您還要讓我們去聽講座,但我們都聽不懂。

姚先生說:“沒有關係,聽你聽不懂的講座可以培養科學家的氣質。”這其實也挺對的,因爲大部分時候就是聽不懂,但聽着可能就聽懂了。或者你大概也能從裡面收穫到一點東西,那對你也是有用的。

讀書的時候,大家會覺得所有的東西都要搞懂。但可能來姚班就會發現:怎麼這些人是這個樣子的?這個東西怎麼這麼難?你很快就會意識到,反正有很多東西都是不懂的。有很多類似的一些話,那個時候可能你印象挺深刻的,它確實對你產生了很多的影響。

《硅谷101》:姚班有哪些非常厲害的科技公司的創始人,以及有哪些非常頂級的學者?

吳翼:比如說四字班(2004年)的樓天城,小馬智行的CTO,也是競賽出身。在學界有四字班的鬲融,是清華計算機系歷史上非常傳奇的一個人物,基本上門門功課考第一的那種。鬲融現在在杜克大學,他也是斯隆Fellowship(斯隆研究獎)。

五字班,當時有周源,在UIUC當助理教授,然後回到清華。

六字班就有曠視科技的唐文斌,還有楊沐和印奇。

八字班出了好多人,比如陳丹琦,是在普林斯頓做自然語言處理的助理教授,她的老公俞華程也是八字班的同學,也在普林斯頓。八字班還有在斯坦福任教的馬騰宇,最近也開了自己的公司Voyage AI。馬騰宇和陳丹琦應該都是斯隆Fellowship(斯隆研究獎)。

九字班的有七八位是在高校任教職的 ,比如吳佳俊在斯坦福當助理教授,他當時是我隔壁宿舍的。我們這屆其實也有不少開公司的,我自己開了一個小公司,也是做大模型Agent的相關的公司。

再往後比較年輕的三字班,劉壯應該是剛去普林斯頓當教授。

分界線在八字班左右,基本上每一屆都能數出來好幾個在頂級高校,每個Top10高校有任職的。甚至Top5、Top6 大學任教的每一屆都會有。從他們任教開始,也就是說從姚班成立到第一批學生,到可以在美國最頂級的高校任教,可能花了10年。

《硅谷101》:在AI產業裡面的人呢?

吳翼:產業都是剛好和人工智能相關。像自動駕駛,小馬智行是最早的公司。上一代人工智能創業公司有Face++,曠視科技。

大模型這一代的創業公司裡面,叉院的老師參與的會非常多。我自己是一個例子。大模型方面,楊植麟也在我們院任教過很長一段時間。最近的具身智能這一波,其實也好多公司都有我們院老師的參與或者團隊參與。

其實也很有意思,因爲姚班確實是不管是匯聚老師也好,還是匯聚學生也好,是把中國相當一部分最好的人才聚集在一起。而這幾波創業浪潮,恰好也都是技術驅動的。那麼對人才的要求就會比較高,所以創業的趨勢恰好和姚班的特點比較匹配,所以我們確實趕上了好的時間能夠參與進去。

《硅谷101》:還有一個原因是不是因爲首先是有姚期智先生牽頭?同時你們是一個非常年輕的院系,它沒有歷史的包袱在裡面,所以它能發展得很快?

吳翼:如果看院系發展的話,它確實是一個年輕的院系,他的包袱會少一點。比如我們在做課程改革的時候,不管是人事還是招聘,還是在教學方案培養上,都是可以變化得很快很靈活,這是一方面。我確實覺得跟姚先生自己他花的時間和他投入的自己的聲譽和精力都是很有關係的。

比如最早期的時候,爲什麼在清華還沒有是任何世界一流計算機研究命題的時候,能夠吸引到一批國際學者和最好的學者來給姚班上課?在最早期的時候,我們其實有很多的課是微軟亞洲研究院的老師來上課的,這些其實都是靠姚先生自己的個人光環。當他在做完這一步啓動之後,開始能夠吸引到更多的海外的老師回來任教,再往後面的工作都順其自然了。

到現在,我覺得姚班的發展就很正規了。比如基本上我們所有的老師都是美國Top4 CS PHD 項目回來的老師。在這種情況下,姚先生就不太用操心每個課到底誰開。基本上每個課的每個方向都有最好的老師去教授,他不太用管這些事情了。但在早期的時候,每一門課其實都需要花很多心思的,他要去找誰。

《硅谷101》:姚先生會自己去寫教材嗎?

吳翼:他自己也會上課,姚太太其實也給我們上過課,親自給我們上一些前沿的課程。然後去請人回來也很重要,因爲這個其實就是賣面子。

《硅谷101》:而且能擴展大家的視野。

吳翼:在大家看不到外面的世界的時候,是需要有人能看到最好的人長成什麼樣的。沒有姚先生牽這個頭,並且他願意親自去賣這個面子,是做不到的。所以萬事開頭難,最早的幾屆永遠是最困難。

02 “姚班”可以複製嗎?

《硅谷101》:你現在覺得姚班的傳奇可以複製嗎?比如說其他院校的老師,能夠找到一個足夠重量級的教授來去複製姚班的這套模式,能不能打造成一個綜合實力非常強的研究院?

吳翼:有相當多的地方都在複製這樣的培養方式,我覺得其實對學生來說是一件非常好的事情。大家都發現姚班原來給予優秀的學生最好的資源,他們是可以涌現出這樣最好的教學成果,很多高校其實都在模仿。

姚班也是在往前走的,不是就停在原地。所以我覺得再加上人才的密度和培養的模式,總是需要累積和時間的。

一個班級的慣性也好,還是他的培養體系,以及他師資的團隊,以及他的研究的整個氛圍是一步一步往前走的,那麼其他學校我覺得是可複製的。如果他能找到同樣的資源和時間,並且大家真的可以湊出這樣的人,但是也是需要時間的。

第二個角度是我覺得不能以現在的標準來看,我們想的應該是在2004年或者2005年那個時間點,是不是有可能有別的人把這件事情做成?就像我們總說,百度搜索不好用,但是回到2000年那個時間點,也未必有人能比百度做得更好。

所以我們是不能拋開時間點來看這樣的事情的。在那個時間點清華甚至沒有一節計算機理論課。就算是清華,我們也得客觀地說,那個年代幾乎沒有人能夠在頂級會議上發論文的。

現在大家都知道了清華的論文數量跟美國的高校比也完全不落下風。但是那個年代是沒有的,所以我們不能跳脫那個時代來看這個問題。

在那個年代我覺得是不可複製的,甚至即使在現在我覺得依然不太可複製。但有沒有可能在未來的十年裡有一個新的集體出現呢?我覺得是好事,因爲出現的越多,對中國的教育也是一件好事。

《硅谷101》:你現在也在叉院做助理教授,你覺得目前還有哪些挑戰是沒有被解決的?

吳翼:我覺得不能叫沒有被解決,我發現每一代人真的很不一樣,你會有一種很強烈的感覺,一代人做一代人的事情。

因爲我跟2004、2005的人,也就是十年前的人很熟;我自己又屬於一代人,然後我自己又當班主任,所以我會觀察到後面一代人,是很不一樣的。

你去訪問一個2004屆、2005屆的大師兄,問你當年爲什麼要選理論這個方向?所有人的回答基本都是姚先生極強大的個人魅力。

到我們這屆開始的時候,我們開始知道要出去看看AI,看看別的方向,然後自己想去尋求機會。也有很多同學是做理論的,但是大家會開始考慮是不是可以去做AI、去做機器學習、去做一做別的什麼東西。會開始想我們是不是要去海外去看一看。總體來說,我們是處在一個我很想去找機會的一個狀態。

但是你看現在的小孩的心態就完全不一樣,他們有好多選擇。他們常跟我說:吳老師我這個項目做完了就不想做了。我說:你後面什麼計劃?他說:我想去MIT看看。他們也會更自信。

比如在我那個年代,我們其實是沒有太多的選擇。那時候清華已經有團隊能發頂級會議論文了,但是還是很少。我2012年第一次發NIPS(神經信息處理系統大會 Conference on Neural Information Processing Systems)的時候,那個時候可能NIPS只有60篇論文,可能清華有幾個老師能發一兩篇論文。但現在不一樣了,現在清華也能發非常多的論文。

所以那時候還是想,有沒有一個地方能夠給我一個機會,讓我去證明自己。現在的小孩有這麼多種選擇,他們會比我們更自信一些,發自內心的這種自信一些。他們也確實有更好的資源。

這個事情就是一代一代的。先有姚先生的個人魅力,能夠讓一些學生開始走向世界一流,他們都是在比較偏理論的方向,然後他們會再回來吸引到一批不同方向的老師。有了這些老師之後會培養出新的一批學生,而這一批學生成爲在世界上可以站得住腳的研究的學者之後,再培養出的學生,他們就會更有第一視角。

所以回答你的問題,有沒有什麼未解決的問題?我很難說我知道有什麼問題沒有解決,因爲你其實不知道下一代人會長成什麼樣,我們不太能夠預判說下一個時代長成什麼樣,但是你知道的事情是,這個時代一定在往前走。

《硅谷101》:大家的想法不太一樣了。

吳翼:它是一個好事。一代更比一代強,就應該是這樣的。所以很難說後來有什麼新的結果,只能說我這代人也只能做我這代人的事情。

《硅谷101》:你的目標是培養更多的優秀學者,還是培養優秀的產業界人才?或者只需要培養優秀的人才即可。

吳翼:我覺得不同的老師可能不一樣。我的風格比較特殊,更像帶Startup創業團隊。這可能與我個人的風格有關,也可能與我在OpenAI早期工作時的風格有關。我的風格傾向於完成整個項目。我不認爲應該根據一個人最終成爲教師還是進入工業界來判斷如何培養人才。因此,我會按照自己的風格和想法與他們溝通。最終,他們自己決定是成爲教師還是進入公司。

《硅谷101》:現在清華叉院在哪些方向有很強的科研實力呢?

吳翼:首先,我們的理論計算機科學做得非常好。每年都有很多優秀的學生,他們現在甚至可以在本科階段就發表一些頂級論文級別的成果,非常厲害。此外,我們系統方向也有很多非常優秀的教師,他們在美國可以獲得很好的教職,也都回來了。

還有一家“北極雄芯”,專門做Chiplet芯片的研發,還有一家公司專門從事加密計算芯片的研發,還有一些硬件公司。

當然,AI方向在過去幾年中也非常強,尤其是大模型和具身智能。我們可能是具身智能這個方向人才密度最高的一個學院了。

《硅谷101》:具身智能的比較厲害的公司是?

吳翼:我們院自己是有一個孵化出去的,是陳建宇老師的星動紀元,做人形機器人的公司,這也是清華自己的項目。還有我們院的像高陽老師、許華哲老師、趙行老師也有很多參與的,或者說他們團隊有聯繫和合作的公司。

《硅谷101》:我觀察到現在整個在人工智能的方向,從學術或者研究,向工業的轉換,這個鏈條已經越來越短了。

比如我們以前在科研跟工業之間,可能還存在着一個前沿學界研究。但是你要把這個東西拿來應用,可能是需要花很多年的時間的。但是我覺得在人工智能這個方向,尤其是OpenAI,特別是大模型出來之後,研究向工業的轉換就變得越來越短了。

提一個假設性的問題。因爲現在整個清華叉院它的人才密度也很高,同時你們也有非常多的研究在同時進行,你覺得有沒有可能清華獨立研究的大模型能夠衝出來?

因爲我知道現在很多美國的高校,他們也在跟美國國會遊說,因爲工業界是能募集到最多的錢的,如果我們這個事情只任由工業界去發展,不給學術界支持的話,整個學術圈的研發實力就會下降。有沒有可能未來的一些突破可以從學術圈先開始,或者說學術圈能做一個媲美工業圈同樣質量或者更好的大模型?

吳翼:首先第一個角度是,爲什麼週期變短了?我認爲不是轉化週期變短了,而是AI的發展趨勢導致AI的發展特別注重工程,並且成本越來越高了。這使得很多規模化的研究不再是一兩個人可以獨立完成的,因此需要更高效或更強的運營實體和團隊來完成這些工作。因此,將許多工程化研究工作移交給公司更爲合適。這也是爲什麼很多學校難以開展此類研究的原因之一。

第二個問題是,是否有可能在國內學校裡創造出一個與工業界相媲美的大型模型。但這個問題不太可能實現,因爲它就是純成本問題。比如,現在我們談論的大型模型都是使用萬卡集羣,不考慮其他因素,我們需要1萬張卡才能訓練一個大型模型,而且我們需要大量的參數數據,那麼這些數據是誰清洗的呢?如果我們搭建這樣一個系統,讓它運行一個月,保證不出錯,編寫這樣的系統並不是幾個博士生能夠完成的任務。

學校研究運營體制以博士生爲主,每個博士生都有自己的課題。這種大規模工程類似於歐洲的量子對撞機,難以指望由博士生組成的團隊完成。

當然,歐洲量子對撞機也是由一羣博士生和研究員建造的。但問題是,需要投入大量資金,成本也很高。我認爲,這不是僅僅因爲錢的問題,而是因爲我們是否能夠像研究量子碰撞那樣,花費如此長時間來解決一個科學問題。AI的發展速度要求很高。

例如,如果我們想要驗證引力波,這是一個巨大的項目,也養活了許多博士生。但我們是否真的願意花費30年或20年的時間來研究一個問題呢?

在人工智能這個具有極高經濟價值的領域中,如果非要通過研究體制來完成一項任務,實際上是非常低效的。如果讓學術界來完成這項任務,根據其組織形式和週期來看,可能需要3到5年的時間,也就是需要3到5倍的時間才能完成。這不是不可能的,因爲我們可以參考所有重大科研問題的解決方式,它們是可以做到的,只是組織程度會更慢。

商業是一個組織程度更快、競爭更加激烈的模式。是否有可能這樣做呢?我認爲這是不太可能的,因爲它沒有必要,這是一種很大的浪費。

《硅谷101》:還是效率上它不是一個最高的承載的形式。

吳翼:爲什麼NASA要把它的一些項目轉移到SpaceX?其實是一個邏輯,如果它能產生商業價值的話,商業可能就是效率最高的一種行爲。

但是,回到研究本身,我們需要以十年爲尺度來看待它。我們可能會認爲現在做一個研究,在兩年後就可以產生AGI,但實際上並不是這樣的。

我們要去看AGI是怎麼來的。最早要從Hinton開始,他做Backpropagation(反向傳播算法),然後發Nature的論文,那是80年代。然後到90年代有楊立昆,到2000年左右有Yoshua Bengio開始做神經與概率語言模型,然後到AlexNet,之後再到OpenAI的 Ilya Sutskever,中間花了四十年的時間。

楊立昆前段時間說了一句話,我覺得他某種程度上是對的,當然他是經常會跟現場的一些主流唱反調,他說的話不一定都對。他有一句話說的是:如果你讀PhD,那不應該做大語言模型。這句話本身我覺得對於大部分PhD來說是不公平的,因爲你不能說你爲了成爲Hinton而讓大部分的學生都不去做這些研究。

大部分的學生,99.9%的人還不是Hinton,但是從培養Hinton的角度,如果你想去做一個顛覆式的、最重量級的創新,那確實你不應該看現在最火的東西,你應該back to the next big thing。

某種程度上科研是應該有人去做這樣自由的探索的。如果你想去做大模型,現在來看最合適的體制就是在公司裡,在商業競爭環境下,它才能前進地最快。

如果你想去做,就去尋找一些這樣的機會。我覺得很多公司也是很開放的,比如我在伯克利的時候,很多大公司都跟伯克利合作。在清華的時候,其實有很多機會跟很多公司有合作。

如果是學術研究,我會覺得還是迴歸學術研究的本質。你去做一些有意思的事情,做一些有創新的東西,做一些大家沒有想到的角度,它也是迴歸學術本質的一件事情。什麼合適的體制和機制去做一件什麼樣的事情。

《硅谷101》:我上一期訪問了陳羽北,你應該也認識。他在節目裡面說了跟你一樣的話,如果你是博士,不應該去研究大模型。然後你其實開始的時候,有提到你早期在OpenAI實習。它其實也是一個項目組一個項目組的,然後以這種項目制的方式來進行。當時你在的時候,是在研究智能體的方向,2020年它其實是有一篇GPT3的論文出來,你當時有注意到那個方向嗎?

吳翼:GPT3其實內部2019年就已經看到了,所有的論文裡寫的東西,2019年的上半年其實大家都已經看到了,當然這是公司內非常重要的一個方向。但當時的OpenAI更像是一個研究院。

他們有一個Charter,即對外公開如何實現AGI,他們的邏輯很簡單,即AGI必須具備視覺能力、語言能力和決策能力,因此他們有視覺團隊、語言團隊和強化學習團隊。此外,他們還需要交互能力,因此需要更多的智能團隊。他們還有一個本體,因此需要機器人團隊。當然,他們還需要考慮安全性和可解釋性等問題。因此,他們基本上是根據AGI的方向來確定團隊的。

但是所有的團隊有個比較標準的原則,就是我們希望 Scale up,這個也是OpenAI能跑出來的一個原因,是因爲Scale up這件事情這麼篤定堅信的人其實很少,直到ChatGPT,大家發現可以出ChatGPT,大家一起Scale up。

就是一個人告訴你,他可行的時候,和你根本不知道的時候是不一樣的。所以OpenAI是幾個創始人非常篤定的堅信,其實就是Ilya。我覺得Ilya給OpenAI帶來最大的財富,就是他真的很堅信這件事情,矢志不渝的堅信,所以最後排除萬難做成了,就發現真的有效果。

所以那個時候不管是做強化學習也好,還是做大模型也好,還是語言模型也好,大家都是採取Scale up的路線的,不在小規模計算上去做文章,這是統一的。因爲我們OpenAI內部是有很多交流,All Hands會去每個團隊分享在做什麼。

所以2019年的時候,就看到大模型在內部去使用。你會發現這個東西有點厲害,只是在那個時候得非常懂行的人才能意識到這個模型很厲害,因爲那個時候的GPT它不好用。普通人使用時會感到困惑,比如爲什麼老說胡話、重複自己的話等。後來做了對齊和chat,叫做alignment或instruction following,目的是讓模型遵循人類的指令,比如讓人幫忙寫篇文章,它就得寫篇符合要求的文章,而不是簡單的回答“好”。

因此,在這些東西都準備好之後,正好是ChatGPT,於是它突然爆發了。但是在此之前,這些能力在19年就已經被大家看到了。雖然我很早就看到了這個東西,但我並沒有那麼確定,否則我應該在20年前就在中國開始研究了。當時我沒有那麼確定。

所以是直到這些東西都做好之後,剛好那個點是ChatGPT,所以它突然就爆了。但之前在2019年的時候大家都已經看到了,所以我確實是很早就看到了這個東西,但是我確實也沒有那麼篤定,不然我回國的時候,2020年就應該做在中國做一個。

《硅谷101》:你當時爲什麼不那麼篤定?

吳翼:我認爲有幾個方向,我的興趣可能是做交互。我一直認爲語言和決策是很好的交互方式。我從強化學習的角度出發,回來後搭建了一套與OpenAI類似的強化學習訓練系統。我沒有做語言模型,因爲沒有人能預測到GPT3的成功。即使是OpenAI自己也沒有預測到,內部的人也沒有預料到。

《硅谷101》:那個時候大家雖然看到了一些科學上的進展,但是它的進展不那麼明顯,它沒有到一個質的飛躍。

吳翼:那個點是很奇怪的,我問過我的同事,ChatGPT只做了一個禮拜,沒有人知道它一定可以成功,一定可以有這麼大的社會影響力。GPT3其實它有很強的影響力,它是當時的Best paper。在整個學術圈是很轟動的,但是沒有真的擴散到這麼大。

我當時可能也是對AI到來的速度沒有做好那麼強的準備,可能跟疫情有關係,大家想的問題都確實沒有那麼篤定。所以現在回頭來看OpenAI能夠那麼堅持一個方向那麼多年,確實也是挺難得的。

《硅谷101》:Ilya爲什麼那麼篤定?

吳翼:他就是這麼一個很偏執的人,一個正常人是不會這麼篤定的。當然這個事是在於他最後成功了。所以大家不能總是回頭看最成功的人是怎麼樣的,因爲所有成功的人都能找出一萬個理由。

在同時我想跟大家說的是,在OpenAI的同時期,其實有很多創業公司做AI。甚至是做AGI的創業公司,也不止我們一家。當時伯克利有個我同組的師兄,也是去了一家做AGI的創業公司,它的路線是邏輯推理,把邏輯的東西放在AI裡邊去,最後這個公司被DeepMind收購了。

但是我想說,同時期在美國做AGI的公司不是隻有OpenAI,只是OpenAI跑出來了。當然現在可以回過頭去分析它成功有好多的原因:首先是有毅力,可能Sam在合適的時候引入了投資,然後大家做 Scaling的路線又是正確的。

但也有別的公司,甚至也有NGO的公司, 比如Allen Institute for AI (AI2)。做語言做對話的也不只有OpenAI,比如有一個Semantic Machine,後來被微軟收購了,當時也是斯坦福和伯克利最好的老師一起做的一個公司,是傳統對話模型的巔峰。他們是把編程語言和對話模型放在了一起,做了一個被合併到微軟產品裡面去的一套系統。

有很多這樣的公司。最後只是OpenAI大成了,所以我覺得是大家看問題可能稍微辯證一點,也有人在做別的東西但他失敗了。當然他們有個共性就是所有成功的人都押注了一個東西。

《硅谷101》:我知道OpenAI裡面有非常多的研究項目,但沒想到它們之間有如此完整的邏輯關係,聽了你的講解後,我才意識到他們的研究架構非常清晰。儘管如此,在這麼多清晰的研究架構中,仍然有一個非常小的方向脫穎而出。

吳翼:確實是這樣,它在早年的時候是有一個比較大的章程,章程也會調整。在那個時候,大家會按照這樣的組織方式去看AI和AGI。確實是語言模型和視覺的投入是挺多的,強化學習組人很多,我們組大概6個人左右,強化學習組或者機器人組的會人多一點,語言模型也會人稍微多一點。但是人的規模就是小几十號人,因爲公司一共才100人。

確實最後是語言上這個東西跑出來。當然你可以說這裡有特別多的證據,比如說人類的智慧其實就是語言,你可以現在這麼說,要是OpenAI早就知道這件事情,我覺得GPT3還能早兩年出來。

但是大家都不知道,是在迷霧裡面往前走。

03 精英教育與普世教育

《硅谷101》:不管是在姚班,然後一系列的頂尖公司的工作經歷,以及現在做清華叉院的助理教授的經歷,你一直是在跟領域裡面最頂級的人才一起合作的。如果讓你總結,你覺得非常頂級的人才,他們有一些什麼樣的特質?或者你容易被什麼樣的特質所打動跟吸引?

吳翼:不同人的風格其實差別挺大的。這些聰明的學生有一個共同點,就是都有很強的自我驅動能力。在這個世界上,無論是成功還是取得成績,都需要你自己去努力。在大學之後,沒有人會強迫你做任何事情。大部分的事情都是你自己想做的,這是最低的要求。

在學校裡,你還可以依靠成績和學術成就來獲得認可。但在社會上,沒有人會教你,你需要自己思考並決定要做什麼。因此,我認爲這些人通常都有很強的自我驅動能力,知道自己的目標是什麼。

我認爲我們應該根據自己的興趣和能力來選擇職業。我們需要找到一個我們喜歡並願意投入大量時間和精力的事情。此外,我們通常會發現那些我們最敬佩的人,他們都有自己獨特的見解和理解。這些見解和理解是他們自己思考得出的,因爲他們願意去思考。

《硅谷101》:有哪些是大家普遍認爲正確的,但你有自己的看法?這可能是投資人最喜歡問的問題之一。

吳翼:我覺得回顧過去的12年,我的很多觀點都發生了變化。這與我對世界的認知有關。我不在乎對錯,關鍵是不斷思考並調整自己的想法。因爲我曾經認爲自己能夠看懂世界,但後來發現自己的看法並不正確。

如果你沒有經歷過,沒有踩過坑,你怎麼能知道一個非共識的事情呢?現在我有一個小經驗,就是在某個時間點,如果所有人都認爲你是正確的,那麼你應該再思考一下。一旦你覺得所有的話別人都覺得很好,那麼你應該再想想,尤其是當你不是親歷者的時候。

因爲人們很容易陷入舒適圈,覺得自己說得對,朋友也覺得對,所以你會覺得自己是對的。

但實際上,世界上沒有絕對的東西,總會有一些你看不到的一面。但是因爲你遇到的人都認爲你說的是對的,所以你可能沒有動力去尋找到底哪裡不對勁。這是我的建議。首先,永遠不要太自信,因爲通常都會有問題。

第二件事情是不要太焦慮,因爲反正你想的所有東西都是有問題的,接受這一點。

《硅谷101》:這兩句總結很經典。

吳翼:第二件事情是這些比較有自驅力、還比較能折騰的人,一般心態都比較好,因爲折騰等於受挫,折騰等於失敗,因爲你不折騰就不會失敗,就永遠不會失敗。只要做了就有可能會失敗,就會踩坑,就會遇到一些不順心的事情,一個人能夠一直折騰下來,一般心態都好一點。他要麼自己特別自洽,有可能比較淡然,一般心態比較好。

所以我認爲能突破的,一個就是能折騰的時候多折騰一點,其實人是怕待在自己的舒適圈裡面待太久了,你可能會喪失你的一些敏銳的感覺,就像我說的,很多人說你對的時候你可能就有問題。

第二件事情就是心態好一點,因爲如果你天天心態不好,可能就熬不到那個時候。

《硅谷101》:所以很多時候考驗的最後是大家的心力值。

吳翼:確實是這樣。在姚班上學這個事情,確實會給人挺多打擊的。

我印象深刻的是大一剛進學校時,我參加了一個競賽,覺得自己很厲害。但是後來我們做一門課的作業,是有一個美國老師給我們佈置的,難度很高。我在宿舍裡整天盯着題目做,但是一直做不出來。於是我就去找我的一個同學幫忙,他正在打遊戲,我問他能不能幫我看看這道題怎麼做。他很好心地停下來幫我解答,雖然他還在打CS,我不知道他的隊友是怎麼忍受他的。他就拿了根筆,寫寫就完了,幫我解決了問題。

我覺得這件事很離譜,衝擊是很大。你就會覺得怎麼有些人和人的智商的差別,比人跟動物的差別還要大。其實很多小孩進姚班的時候會有這樣的挫敗感,所以我們也是很多時候會希望能幫他調整過來。

就是你回頭看這些,我們混得還不錯的,其實都挺chill的。我有一個同學現在在CMU當faculty,後來他去了沙特當faculty跳槽了,他就天天在宿舍裡用觸摸板打dota,我印象特別深。那時大家沒有特別焦慮,我們還天天踢球什麼的,大家關係都挺好的。

天天焦慮的人一般堅持不到十年之後。

《硅谷101》:我注意到很多學校在培養人的時候,在學術上是有一套培養方法的。但你剛剛講到很多事情,其實尤其是步入社會之後,很多時候是心態。你覺得清華姚班會注重對大家心態的培養嗎?

吳翼:有幾方面,一個是姚先生自己的個人魅力,他確實會給我們很多high level的、比較大師的一些指導,這些話我覺得反正年輕的小孩肯定都聽不懂,這很正常。

因爲我自己經歷過這十年,我現在看就會覺得老闆說的好,但放在十年前我不可能聽懂的,甚至我可能現在也沒有完全聽懂。

所以肯定是姚先生自己的個人魅力能給大家帶來一些啓發,但更多的事情還是學生自己相互之間的,我覺得總體來說姚班大家互相幫助的氣氛還是不錯的。比如這一屆剛畢業的零字班,其實都是整個班級氛圍非常好的班級,相互幫助,真的不是大家獨立作戰的。

我記得13級畢業的時候有特別經典的一個事:當時畢業的時候要送個禮物,是他們班裡面發的論文,當時發了40多篇論文,然後好像他們畫了一下他們 Co-Author的示意圖,展示了許多互相的合作關係。

可能不是每一屆學生都這樣。只能說姚班有這樣一些傳承,但其實很多引導是潛移默化的,它也不是刻意的。可能也不是每一級都這樣,這種化學反應的事情也不可控,尤其現在姚班有七八十個人了之後,其實不可控的因素會變得更大。

可能這就是我們這一代人想做的事情,我們就希望能讓這些學生心態好一點,能夠讓他們更平和地去做他們想做的事情。這可能是我們這一代人的回到學校之後的命題,所以每個大學生確實命題不一樣。

在早期的姚班招生其實是以數學競賽爲主,因爲姚班最早的時候是以理論計算機科學爲主,所以它的很多選拔和招生是比較偏向物理和數學的。

我那一屆計算機競賽進入姚班的只有4個人,我們班30個人。我跟我的室友是國家隊,佳俊是考進來的,另外一個同學是最後面試進來的。很長一段時間都是以數學爲主,因爲總體的培養比較偏理論,大家覺得數學基礎比較重要。慢慢開始就隨着人數比較多了之後,我們現在七八十個人,招生面就會比較廣。30個人的時候其實競爭還挺激烈的,所以那時候在進入國家隊之前,我都不知道我能不能進姚班。

《硅谷101》:你開始的時候是不是就已經有一個目標了?

吳翼:確實大家都想去,但是就很擔心最後別真考數學,然後考不過。我後來發現這幫小孩也都很聰明,他們一般保送了之後就在家刷半年數學物理,考試都考得很好,也能進。因爲現在我帶的班裡面的學生,我就問你們當時怎麼複習的,他說知道考物理和數學,我們在家就專門學了半年。

《硅谷101》:你覺得好的人才是篩選出來的還是培養出來的?當然我知道這兩者都很重要,但是我更想知道是這些人他本來就很聰明,還是說他可以以一種好的方式把他培養得更好。

吳翼:有一本書叫做《The Greatest Cannot Be Planned》,就是講偉大的事情是不可能被計劃的,所以我想說人才確實是被培養出來的,但不是被計劃出來的。

首先他需要選拔,因爲我覺得精英教育和普世教育是不太一樣的,因爲精英教育其實是蠻殘酷的。比如本來我們是在高中的時候搞競賽,在全國搞競賽,然後到了姚班、伯克利,每一次的這樣的選拔和競爭都是非常殘酷的。但選拔是不可避免的,因爲你如果希望最後培養的是最頂尖的人,它就是在競爭中產生的。其實企業也是,研究也是,人也是,所以選拔是不可避免的。

培養要不要?培養是需要的,你需要給這些人足夠的空間,你也需要給他們足夠的適度的壓力,不能沒有壓力,讓他們往天上看。因爲在大家沒有習慣於往上看的時候,老師是需要做這樣的引導。

但是這是培養和選拔之後。但是不是可以確定一定能夠出來誰?不知道,這個是不可預測的,只能說按這麼做,大概率10年之後應該會有人成功,但是會是誰你不知道。

所以選拔很重要,培養很重要,但是也要做好有可能很多人沒有成功。比如說姚班30多個人,我們班算是當老師非常高的一屆了,我們可能就1/3的人在當教師,剩下的人就靠自己了。所以人才是培養和選拔,但是沒法被計劃。