不久前,谷歌公布未來人工智能新布局,整合之前零散分布并各自獨立于云計算業(yè)務(wù)部的各個機(jī)器學(xué)習(xí)團(tuán)隊,成立了新組織,并任命一位華人女性為新組織的首席科學(xué)家。消息一出,令業(yè)界震驚又興奮。
這位科學(xué)家名叫李飛飛,是當(dāng)今站在金字塔頂端的科學(xué)家之一。她36歲就成為斯坦福大學(xué)終身教授,任斯坦福人工智能實驗室和視覺實驗室的主任。她倡導(dǎo)的 ImageNet 競賽,每年都牽動著整個業(yè)界的心弦。她的高質(zhì)量論文,在頂級期刊發(fā)表超過100篇,被引用高達(dá)4萬余次。她入選“世界百大思想者”,被評為美國“年度杰出移民”之一(愛因斯坦、基辛格也曾獲此殊榮)。
從中國到美國,握住命運李飛飛如今光鮮亮麗的背后,還有一段不平凡的早年人生。她1976年出生于北京一戶普通家庭,父母起的名字也極其普通:“飛飛”。 李飛飛出生后不久,一家人就搬到了四川成都。
當(dāng)時生活條件不高,成都遠(yuǎn)沒有今天繁華。但飛飛父母特別保護(hù)孩子的求知欲和好奇心,只要成都有展覽就帶飛飛去,盡可能擴(kuò)大她的眼界,接觸更大的世界、更新奇的事物。同時家里還有一條很有趣的家規(guī):飛飛放學(xué)回家后只能在40分鐘內(nèi)做作業(yè),40分鐘后就可以看課外書、可以玩,干啥都可以,但就是不能再做作業(yè)。父母此舉就是為飛飛養(yǎng)成專注高效的習(xí)慣,做事不拖延不左顧右盼,然后為自己留出充足時間,做自己感興趣的事。
有了濃厚興趣和好習(xí)慣的保障,飛飛從小學(xué)習(xí)就不錯,后來考進(jìn)四川重點中學(xué)成都七中(今為成都中學(xué),全國四所國家級示范高中之一)。
進(jìn)入成都七中前途似乎就一片光明,然而這時李飛飛的命運卻迎來了重大轉(zhuǎn)折。為了夢想,她父親決定到美國打拼,后來母親帶她也去了美國。當(dāng)時李飛飛僅16歲,陡然間進(jìn)入一個語言、文化完全迥異的環(huán)境,如何適應(yīng)生存下去,成為李飛飛面臨的最大障礙。
另一大障礙,就是沒有錢。李飛飛父母雖然都受過高等教育,但英語關(guān)過不了,無法從事類似于國內(nèi)的好工作。迫于生計,父親成了照相機(jī)修理工,母親成了超市收銀員,勉強(qiáng)維持溫飽。因此除了上學(xué),她還要盡可能補(bǔ)貼家用,課余時間去中餐館、洗衣店打零工,去別人家打掃房子。打工和上學(xué)就成了她適應(yīng)美國新生活的全部內(nèi)容,最辛苦時一天睡不到4小時。
精英學(xué)霸,執(zhí)著夢想但在生活學(xué)習(xí)的重壓下,李飛飛從沒屈服。也得益于幼年養(yǎng)成的好習(xí)慣,不到3年時間,在1995年高中畢業(yè)時,李飛飛已經(jīng)從聽不懂英語的移民“差生”,躍升至成績前5%、排名第6的優(yōu)秀畢業(yè)生,而且她還以最高榮譽(yù)拿到了世界名校普林斯頓大學(xué)的錄取通知書,并且獲得普林斯頓提供的全額獎學(xué)金。這個優(yōu)異成績連當(dāng)?shù)厝硕己茈y達(dá)到,為此當(dāng)?shù)貓蠹垖iT采訪報道了她。
1999年,李飛飛以優(yōu)異成績獲得普林斯頓大學(xué)物理專業(yè)學(xué)士學(xué)位。當(dāng)時美國就業(yè)形勢大好,華爾街正是牛市,而她獲得了華爾街的青睞,甚至高盛直接給出數(shù)十萬美元年薪錄取她。但是面對高薪又體面的工作,她卻選擇回環(huán)境惡劣的中國西藏,去研究自己一直懷著濃厚興趣的藏醫(yī)藥。這個決定瘋狂又令人費解,但她得到父母支持,因為父母當(dāng)初來美國就是為了實現(xiàn)夢想。
這個決定與她一貫以來的興趣、好奇心、求知欲有關(guān)。李飛飛從小好奇心很強(qiáng),喜歡探求真理,對問題追本溯源,比如宇宙的起源、生命的意義。她渴望擁有這種智慧,夢想通過學(xué)術(shù)研究造福人類,通過科技改變世界。雖然本科學(xué)物理,但她對藏醫(yī)藥的濃厚興趣不減,希望能從科學(xué)、哲學(xué)層面,來研究此神秘領(lǐng)域。
于是接下來整整一年她都呆在西藏,克服高原寒區(qū)各種困難,毫無怨言,愉快地融入當(dāng)?shù)厣钺t(yī)療,進(jìn)行藏醫(yī)藥研究。這段經(jīng)歷對李飛飛影響很大,長久以來,西方的科學(xué)方法論和哲學(xué)思維占據(jù)學(xué)術(shù)界的主導(dǎo)地位,而以藏醫(yī)藥為切入點(之一),她體會到整個人類思想寶庫中完全不同的另一面,對于突破西方哲學(xué)、科學(xué)的方法論大有裨益。
研究冷門,依舊夢想
從西藏回來后,李飛飛沒有進(jìn)入職場,而是選擇攻讀研究生。在父母支持和自己辛勤努力下,李飛飛拿到了加州理工學(xué)院電子工程專業(yè)的博士學(xué)位,具體研究方向是人工智能和計算神經(jīng)科學(xué)。這絕對是一把炙手可熱的金鑰匙,當(dāng)時無數(shù)人趨之若鶩的咨詢公司麥肯錫也向她拋出了入職的橄欖枝。
然而這一次李飛飛又拒絕了,轉(zhuǎn)而選擇進(jìn)高校任教做研究,堅守自己以學(xué)術(shù)研究造福世界的夢想,不為金錢不為地位,也不為環(huán)境所迫。不僅如此,在高校工作時她再一次做了“驚人”決定——專攻計算機(jī)圖像識別技術(shù)。這是當(dāng)時的冷門研究,冷門到其他教授看不到結(jié)果,認(rèn)為拿不到終身教授,都不愿與之合作。
通俗地說,計算機(jī)圖像識別就是讓計算機(jī)認(rèn)出任意一張圖片里包含的內(nèi)容。比如讓計算機(jī)認(rèn)貓,那么首先告訴計算機(jī),貓是圓臉、胖身子、兩只尖耳朵和一條長尾巴構(gòu)成的東西。然而現(xiàn)實生活中,單單貓的品種就有成千上萬,就算同一只貓,也可能擺出上百種不同姿勢。如果遇到一些骨骼清奇的貓,換個姿勢可能計算機(jī)就傻眼了。當(dāng)時,圖像識別技術(shù)已發(fā)展了20個年頭,但計算機(jī)能夠識別的物體也不過十幾種。大千世界何其多樣,區(qū)區(qū)這幾種物品遠(yuǎn)遠(yuǎn)不夠。
堅守不懈,成就夢想
面對圖像識別如此匱乏的“詞匯量”,李飛飛卻有瘋狂的想法。她不僅毫不退縮,還“異想天開”拿出字典,要讓圖像識別涵蓋到字典里每一個詞條!
最終確定的方法很原始也很簡單,就是像人類嬰兒識別貓那樣。人類的眼睛就像一架生物照相機(jī),每200毫秒就能獲取一幅圖片。嬰兒從未被灌輸貓的特征,卻能很快認(rèn)出貓,無論什么品種什么姿勢。
因此李飛飛開始訓(xùn)練計算機(jī),讓它看更多圖片。2007年起她在網(wǎng)上下載了近10億幅圖片,然后給它們分類、打標(biāo)簽,建立題庫為計算機(jī)看圖訓(xùn)練而用。由于工作量太大,幾個月后研究經(jīng)費幾乎用光,而且照此進(jìn)度需十幾年才能完成建立題庫的目標(biāo)。在最困難時,李飛飛想過重操舊業(yè)開干洗店籌集經(jīng)費,但從未想過放棄。
當(dāng)大家一籌莫展時,美國最大電商亞馬遜的眾包平臺幫了大忙。通過眾包平臺,李飛飛在網(wǎng)上雇傭了167個國家共計5萬人,給10億張圖片篩選、排序、打標(biāo)簽。2009年時題庫就包含了1500萬張圖片,涵蓋2萬多種物品。最后,這個題庫發(fā)展成今天大名鼎鼎的ImageNet數(shù)據(jù)庫。
更可貴的是,ImageNet如此龐大的圖片數(shù)據(jù)是免費的。它向全球開放,所有致力于計算機(jī)視覺識別技術(shù)的團(tuán)隊,都能從它里面直接拿“試題”,訓(xùn)練自家識別技術(shù)的準(zhǔn)確率。如今計算機(jī)識別的錯誤率已經(jīng)從28%降到3.6%,比人眼識別錯誤率5.1%還要低。這都要歸功于ImageNet數(shù)據(jù)庫以及李飛飛團(tuán)隊的努力。
夢想點亮未來
計算機(jī)圖像識別,是人工智能領(lǐng)域至關(guān)重要的技術(shù),也因此“李飛飛”這三個字如今是AI界無人不曉的名字。
計算機(jī)的圖像識別目前還只是用于識別衣服品牌和人臉,只能給人類一點輔助性幫助,而未來計算機(jī)將學(xué)會如何理解圖片,即自行學(xué)習(xí),能像真正的人類一樣去看待世界。屆時,計算機(jī)將賦予視覺智能,為后世子孫創(chuàng)造更美好的未來。
所有這些AI研究,都是為了最終服務(wù)于人類,就需要學(xué)術(shù)和產(chǎn)業(yè)有效結(jié)合。為拉近AI研究與人類日常生活的距離,也為了使AI更接地氣,或許就是因此李飛飛走出實驗室加入了谷歌。
現(xiàn)在,這位圖像識別領(lǐng)域的領(lǐng)軍人、人工智能頂峰的科學(xué)家、美貌與智慧并存的華裔奇女子,執(zhí)掌了世界上最負(fù)盛名的谷歌AI產(chǎn)業(yè),她會帶來什么樣的AI前景,又會把人類帶到什么樣的未知領(lǐng)域?我們翹首以待吧。