戴文淵:AI落地最大難題是人才 或致估值泡沫破滅
戴文淵(來源:本站財經)
第四範式創始人、CEO戴文淵在2018夏季達沃斯論壇接受了新鮮小隻的專訪。
今年被認爲是後AI時代開啓的一年,行業迎來應用落地,戴文淵表示,如今AI落地最大的難題是人才。AI在很多場景都能實現落地,大的場景包括金融、廣告營銷等,小的場景包括製造業瓷磚最後一道工序的甄別等,但目前AI未能在絕大多數場景落地。戴文淵解釋稱:“並非是AI不能做這些場景,而是沒有人去做。現在的科學家太少了,今天我們只覆蓋了價值最大的場景。”
戴文淵表示,在中國,AI人才的缺口在百萬以上,據樂觀估計,現在真正靠譜的AI科學家可能在千人以下。
在戴文淵看來,資本對AI的預期是十萬億甚至百萬億的市場,行業現在靠得是這些AI科學家來獲取市場,所以獲取市場的速度太慢,而估值增長非常快,是照着10萬億的市場上去的,如果發展跟不上這個速度,那麼行業的泡沫有可能破滅。“如果今天整個AI行業有100萬以上的人才,沒有人會擔心泡沫問題。”戴文淵說。
AI並非無所不能
遷移學習能夠降低AI的數據門檻
記者:人工智能是近幾年來炙手可熱的風口,現在市場上面聲音很多也很雜,在您看來什麼纔是真正的AI?
戴文淵:實際上AI和人的智能會有一定的區分,現在人們可能對AI的理解有一定的誤區。
一種是說人能做什麼,AI能做什麼,比方說會有很多人討論人和AI之間能不能發生一些情感關係這是一方面;另一方面會有一種聲音是覺得人工智能是比人更強,比方說像我自己不知道怎麼做,AI能不能告訴我應該怎麼做。
其實這兩種都不對,從專業的角度來看,AI是一種新的思考的器官,它可能是人的大腦的一個外延,它可能是一個比人更好的,甚至是比大腦更好的一種思考的器官,如果你有一些問題,一是想不清楚,二是你沒有那麼多的精力去想,你可以讓計算機幫你去想,更清楚。
舉個例子,假設新聞編輯在面對1億受衆時,不可能把每個人都分析一遍,理論上是可以的,假設這個編輯精力無窮,可以把每個受衆都分析一遍,給每個人去設計,編輯出每個人愛看的稿,但現實是做不到的。他做不到不是因爲他不夠聰明,而是他精力有限,但是AI的精力是無限的,幾乎是無限的,那如果我們有能力讓AI學會這個編輯,哪怕是70%的能力,AI就能把編輯的思想去外延到每一個人,這就是今天所說的千人千面。
記者:您是遷移學習領域的專家,遷移學習可以解決哪些具體的問題?
戴文淵:遷移學習針對的是一個本領叫做舉一反三或者觸類旁通,這種能力其實對人來說非常平常,我們每個人都有遷移學習的能力,舉個例子,假設我們學過數學,再去學物理時,我們發現學的數學知識都能夠幫助到我們學物理,能讓我們的物理學的更快更好。
但是非常遺憾的是在遷移學習之前,AI沒有這個能力。AI怎麼學呢?我先學數學,數學學完了以後去學物理,會把數學之前學到的所有東西忘記,然後再從零開始學物理,是一個不會數學的人去學物理,這就是爲什麼AI的學習效率會低。
我們知道AI的深度學習需要百萬、千萬以上的數據量才能夠學會,當然人不一樣,往往給人一兩個例子,人就學會了一個方向,這就是人的觸類旁通。
我們今天其實用遷移學習在解決問題,就是說能不能把相關領域,什麼叫相關領域?就像數學,數學相關領域的知識能夠去幫助一個目標領域,比方說物理,能夠學得更好,然後能讓目標領域所需要的數據量降低,深度學習需要百萬千萬以上的數據,我們用遷移學習能夠把這個數據量能降低2-3個數量級。
實際上,今天的遷移學習仍有很長的路要走,我們知道人所需要的數據量大約是幾個就能學會,遷移學習應該需要上萬(數據量),所以,今天的遷移學習雖然比深度學習有很大的進步, 但和人比仍有很大的差距。
那麼遷移學習主要會應用在哪?其實在很多數據豐富的場景並不一定需要用遷移學習,雖然學習效率低,但是我可以更努力,比方說你學五個樣本,我學五千萬個樣本,達到比你更好的效果也可以。但是有些場景是沒有大樣本的,舉個例子,比如說醫療場景下,有些疾病全世界沒有幾個人得過,這就不可能去分析那麼多的樣本,唯一的辦法就是用遷移學習把所需要的樣本數量降低,這是今天遷移學習要解決的問題。
AI落地過程中最大的難題是人才
國內靠譜的AI科學家人數不足千人
記者:今年開始,AI企業開始與更多的行業場景深入結合進行落地,在您看來,AI在落地的過程中難題有哪些?
戴文淵:其實AI在落地過程中最大的難題是人才。
我們所能看到的,實際上現在在很多不同的、千奇百怪的場景其實都能夠落地,大的場景包括金融的風險、廣告的營銷、視覺領域的人臉識別、手寫識別,音頻領域的語音識別,有些小的場景其實都無法想象,比方說製造業瓷磚,瓷磚生產到最後一道工序時,我們要挑出正品和次品,這個事情從技術角度來說也不是那麼難做,但是它是一個非常小的場景,它和人臉識別、安防相比是小場景。類似像這樣的場景其實很多很多,例如像書店的電網,我們怎麼去監控它的電線有沒有斷掉,這些都是一些過去不太容易想到的場景。
在今天,AI爲什麼沒有在這些絕大多數場景落地?其實不是AI不能做這些場景,而是沒有人去做這些場景,因爲今天的科學家太少了,一共就是這麼幾個科學家,那我們把所有的場景拿過來,就請讓這些場景排隊,科學家太少,我們只能從價值最大的場景,往相對價值沒有那麼大的場景去做,(所以)今天我們只覆蓋了價值最大的場景。
但是,如果我們有辦法讓今天的AI科學家的數量提升到今天APP開發者的數量,那整體情況又會完全不一樣,我們知道,APP絕對不是說只有幾個大場景,絕對不是,我們想得到的、想不到的,我們都能找到APP,這是因爲有龐大的開發羣體。
所以其實今天AI落地最大的問題就是人才,也是非常需要去解決的,這個問題不解決可能真的AI泡沫就會擔心到來了。
記者:人才的供應跟不上AI技術的發展
戴文淵:對,市場對AI的預期是,AI是個至少10萬億,以前說大市場叫萬億,AI大家對它的預期是10萬億以上甚至百萬億的市場,但是我們所去獲取市場的速度現在是靠着這些科學家在獲取市場,所以獲取市場的速度是太慢的,然而估值增長是很快的,估值增長是照着10萬億市場以上去的,所以如果我們跟不上,那就有可能這個泡沫就破了。
記者:這個缺口有多大?
戴文淵:人才的缺口在百萬以上。而現在(中國)真正靠譜的AI科學家可能在千以下,這還是相對比較樂觀的估計。
記者:您剛剛提到整個行業的泡沫現象,資本對AI非常看好,導致外界人工智能產生泡沫的這種擔憂,您怎麼看這個現象?
戴文淵:擔憂其實是這樣的,資本其實並不傻,他爲什麼會提前預知這樣的價值,是因爲有這麼大的市場。那麼泡沫什麼時候會出現呢?就是把泡泡吹大了以後,如果你填不滿它就會爆掉,現在所以很關鍵的就是AI落地的速度,就是如果你的落地速度最後能跟上泡泡增長的速度,泡沫就不會破裂,所以現在爲什麼說人才很關鍵,就是人才速度跟得上,AI可能都不是說泡沫的問題,可能是今天的估值又太低了,如果今天整個的AI行業有100萬以上的人才,沒有人會擔心泡沫問題。
記者:今年被認爲是後AI時代的開啓,行業都開始迎來應用落地,甚至說不落地的企業可能就會面臨死亡,您怎麼看待現在AI發展的一個檔口?
戴文淵:我覺得需要去兌現,因爲整個資本市場把AI的水位擡的很高,所以這個階段AI企業需要去兌現之前的承諾,所以爲什麼我們現在非常重視AI人才的問題,我們現在採取的一個方式和我們過去的方式是不一樣的,過去更多的企業採取的方式是我找更多的科學家發展,但是我們的觀點是這個市場一共就不到1000個科學家,你就算把這些人都網羅到一起其實也解決不了這個問題,全世界的AI的科學家都在你的公司也解決不了。
所以另一個思路是什麼,就是我們去找一個更大的羣體把他們變成AI的開發者,我們的觀點是要把過去的APP開發者,過去的java開發者,甚至是業務人員,把他們變成AI的開發者,一旦這件事情做成了,我們就再也不用擔心有沒有100萬的AI開發者的問題了,因爲這個數量是遠遠超過100萬以上的。
(郭瑞超 guoruichao@corp.netease.com)