「每天晚上睡覺前,我都是一邊聽著於謙老師的相聲,一邊想:機器怎麼可能超過這樣有趣的靈魂?我不信。」
「今天的聽眾大部分是中國人,講國語的,所以我的演講會用英文,這是一個很好的機會讓大家練練英語。」
說出這些話的人是湯曉鷗,一個科學家,同樣有著一個有趣的靈魂。
和很多人對科學家「木訥」的刻板印象不同,湯曉鷗善談,愛講段子,愛曬娃,自詡「AI界的郭德綱」。
當然,他在AI界的身份更為著名:既是全球頂級人工智慧科學家,研製出世界上首個準確率超越人眼的面部識別演算法;也是著名「伯樂」,建立了被譽為電腦視覺領域「黃埔軍校」的香港中文大學多媒體實驗室,培養出中國在該領域的半數頂尖人才;還是亞洲最賺錢的AI企業——商湯科技的創始人。
只是,這樣重要又有趣的人,走了。
2023年12月15日深夜,湯曉鷗因病搶救無效去世,年僅55歲。
甘願做跳板
55歲的湯曉鷗,有著符合人們想像的知識份子的幹練氣質。公開露面時,他經常穿著一絲不苟的西裝,戴著眼鏡,笑眯眯的。
1968年,湯曉鷗出生在遼寧鞍山。17歲時,他考上中國頂尖高校之一中國科學技術大學。畢業後,湯曉鷗到美國深造,先是在紐約羅切斯特大學讀研,之後轉到世界頂級高校麻省理工學院讀博。
當時,他進入曾發現泰坦尼克號殘骸的海底機器人實驗室學習,第一次接觸到人臉識別技術,並為此驚歎,「這個很酷」。之後,他決定將其作為自己的研究方向。
1996年,博士畢業的湯曉鷗在香港中文大學找到講師的教職。5年後,他創辦了只有一個博士後做助手的多媒體實驗室,研究人臉識別技術。彼時,他剛三十多歲。
湯曉鷗很快遇到了很多青年學者都會遇到的困難:沒有人脈,缺乏資金,招不到學生。
生源問題尤其嚴重。香港地區高校的優秀學生大多計畫去聲望更高、就業前景更好的美國名校深造,湯曉鷗縱有三寸不爛之舌,也招不到本地優秀學生。
頭腦靈活的他,很快想出一條「曲線救國」道路:到內地招生。
為了增強對學生的吸引力,湯曉鷗甚至明確告訴學生們,不介意他們過來只讀碩士,「如果這之後你想去歐美深造,我幫你一起申請」。
這在當時是「另類」。
很多教授一旦招到研究生,特別是優秀的那些,就不願放他們離開,會想方設法把這些學生留下讀博,繼續給自己「打工」。這在包括電腦在內的工科尤其明顯。
事物的本質有兩個方面,一個是可笑的一面,一個是更可笑的一面。
湯曉鷗反其道而行,他經常把最好的學生送出去。他覺得,站在學生角度考慮,去麻省理工、斯坦福等頂級學府深造,對他們來說是最好的選擇;另一方面,自己也會在無形中受益:學生更願意來讀研,並且出國讀博結束,也願意再回到自己的實驗室工作。
最先被湯曉鷗「盯上」的,是他母校中科大的學弟們,之後是清華等著名高校的學生。那時內地名校的學生素質普遍很高,但缺乏對國際前沿研究的把握,有的中科大精英學子,甚至是在被湯曉鷗邀請到港中文訪學後,才知道電腦視覺領域有三大國際頂級學術會議(國際電腦視覺與模式識別會議;國際電腦視覺大會;歐洲電腦視覺國際會議)。
具備國際視野同時甘願做學生「跳板」的湯曉鷗,很快吸引到一批極其優秀的研究生,其中包括他日後最引以為傲、堪稱天才的三個學生:在中科大拿到本科生最高榮譽「郭沫若獎」的王曉剛、林達華,以及在清華基礎研究班就讀的2003年廣東高考狀元何愷明。
湯曉鷗也沒有耽誤這批「好苗子」。
「華山論劍」與世界第一
招到一群「天才」後,湯曉鷗再一次「不走尋常路」,給他們找了一條與眾不同的成長道路。
湯曉鷗給實驗室定了兩條原則:一是要海量閱讀論文,二是要到國際頂級學術會議上發表論文,他稱之為「華山論劍」。
所謂「海量」,指的是論文以「箱」來計算。林達華記得,他加入港中文多媒體實驗室第一天,就收到湯曉鷗送的幾大箱論文,都是前輩王曉剛看過的。他全部看完,而新的成箱的論文,正在路上。
兩年研究生生涯,林達華總共看完2000多篇論文,基本涵蓋了電腦視覺方向的全部論文。
除了輸入,也要輸出,而且是到最頂級舞臺上。
湯曉鷗覺得,在國際頂級學術會議上發表論文並和最優秀同行切磋,是磨練學生的最佳方式。「做研究就像比武論劍,論劍一定要到華山,如果去太行山或者大別山……華山以外,很難論出好劍。」
港中文多媒體實驗室就此奠定了自己的研究氛圍:以頂級學術會議投稿截止日期為准,制定科研計畫,投稿前熬夜備戰衝刺,並海量閱讀論文。
這種方法訓練下的學生,取得的成績驚人。
普通研究生想都不敢想的三大國際頂級學術會議論文,王曉剛在兩年研究生生涯中發了5篇。畢業後,他成功獲得麻省理工學院的博士錄取通知,並拿到全額獎學金。
取得成績的不僅僅是王曉剛。多年後湯曉鷗曾調侃稱:「曉剛是我見到的第一個天才學生,在碩士階段就發表了5篇國際頂級學術會議論文。他的才華和人品如此出眾,以至於我毫不猶豫地將妹妹嫁給他(真事)。後來我的另一個天才級學生達華髮表了更多文章,可是我已經沒有妹妹可以再嫁了。
好在最近的一個天才級學生靖宇,來的時候就有女朋友了。」
研究生畢業後,林達華和崔靖宇分別收到了麻省理工和斯坦福大學的博士錄取通知,並和王曉剛一樣,拿到了全額獎學金。
一篇篇高水準論文的發表,也推高了港中文多媒體實驗室的地位。
從2005年到2008年,湯曉鷗團隊在國際頂級學術會議上共發表60多篇論文,數量上高居世界第一。
2009年,由湯曉鷗和學生何愷明以及微軟亞洲研究院另一位科學家孫劍合作的論文《基於暗原色的單一圖像去霧技術》被評選為國際電腦視覺與模式識別會議(電腦視覺領域三大國際最高學術會議之一)的年度最佳論文,這是亞洲歷史上第一篇獲此榮譽的論文。
這是港中文多媒體實驗室崛起的標誌,在一次又一次「論劍」中,它已經成為電腦視覺領域的「一方霸主」。
也就在這年,實驗室的研究方向發生「革命」性轉折。
「黑羊」遠去
湯曉鷗意識到了新的研究機遇。
2009年,微軟雷蒙德研究院第一次把深度學習運用到大規模語音識別,很短時間內就取得了一個龐大團隊幾個月才能完成的成果,這在業內引發轟動。
湯曉鷗敏銳覺察到了深度學習領域的潛力,立刻組織團隊「摸著石頭過河」,開始探索。
「先走一步」的優勢很快體現出來。2012年「深度學習」概念爆火,而從2011年到2013年,湯曉鷗團隊在兩個頂級學術會議上一共發表了14篇基於深度學習的研究論文,占了這兩個會議在全球範圍內接收的深度學習論文總量(29篇)的近一半。
2014年,湯曉鷗團隊人臉識別演算法資料庫準確率首次超過人眼識別率;幾個月後,系列演算法準確率進一步提升至99%以上,突破落地門檻。
資本的嗅覺很敏銳,知名投資公司IDG負責人牛奎光立刻飛往香港拜訪湯曉鷗,在多媒體實驗室看了十幾個實驗演示後,很快投出了罕見的、高達數千萬美元的天使輪投資。當年,滴滴這家中國風頭很盛的科技公司,在天使輪之後的A輪也才僅拿到300萬美元融資。
(演講時)組委會很緊張,問我會不會超時,我就保證說,一定會的。
中國視覺AI市場從此拉開帷幕:2014年10月,商湯科技成立。
「商」是中國最古老朝代之一,「湯」是其創始人,用「商湯」這個名字,意味著湯曉鷗對自己團隊創意和成就的希冀。它的另一個意思,則被調侃為「從了商的湯老師」。
湯曉鷗在商湯科技推崇「黑羊」文化。他認為,中國互聯網公司往往有一種「狼性文化」,他們互相競爭,擊垮競爭者。但商湯的文化是「羊文化」,「我們選擇合作,我們都是好人,大家惺惺相惜,我們知道每個人的思維方式是不一樣的,我們的成長路徑不一樣,接受的鍛煉不一樣,我們能夠理解別人的想法,但是當然我們也不想做一只循規蹈矩的羊,因為這樣的羊會隨大流,我們想成為一只黑羊,一只與眾不同的羊」。
正如他當年堅持要做深度學習研究一樣。
商湯科技的口號是「堅持原創」,之後成為中國第一家上市的AI「獨角獸」企業,也是亞洲收入最高的AI企業。
但湯曉鷗在商湯科技最輝煌的2019年前後,就選擇「急流勇退」,卸任董事長和CEO職位,回歸到科研生活中去。
湯曉鷗最後一場公開演講,是在2023年7月的世界人工智慧大會上,他在總結自己最得意的三個學生的學術成就後,引用了於謙主演的電影《老師好》中的一句臺詞,說:「我不是在最好的時光遇見了你們,而是遇見了你們,我才有了這段最好的時光。」
只是,世間再無湯曉鷗。
(王亞坤/文)
中華大地