圖片來源@視覺中國
文|砺石商業評論,作者|高冬梅
2016年3月發生了一件震驚全人類的大事,AI程序AlphaGo打敗了世界頂級圍棋手李世石!
要知道圍棋可是號稱人類發明的最複雜的遊戲。一時間,人工智能即將取代人類的流言四起,引發了對人工智能倫理問題的大討論。 一般人對AlphaGo都多少有些了解,但對創造AlphaGo的人卻不知道。
AlphaGo的創造者是個被稱爲“人類史上最聰明的人之一”的大牛人戴密斯·哈薩比斯(Demis Hassabis),他來自英國的倫敦,不僅是世界AI領域的第一人,還是世界國際象棋大師、電腦遊戲設計師、企業家和神經學家,恐怕世界範圍內再無第二個人能把這些身份融爲一體。
天生我材必有用
哈薩比斯從小就好奇心強、喜歡新鮮事物、興趣廣泛,這種天賦特質讓他不斷主動去征服一個又一個新的領域,棋盤遊戲、電子遊戲、計算機編程無一不精。
1976年7月,哈薩比斯出生于一個多血統家庭,父親是希臘裔塞浦路斯人,母親則來自新加坡華人家庭;他是家中長子,下面還有一弟一妹。
哈薩比斯的父親年輕時是一名創作歌手,後來他家還開過玩具店,再後來他們的父母又都做了教師。父母“放蕩不羁”的生活方式對子女的人生影響深遠。哈薩比斯的妹妹長大後成了一名作曲家和鋼琴演奏家,弟弟成了創造性寫作的作家,但哈薩比斯卻在父母“不要循規蹈矩,堅持走自己的路”的教導下突變爲家裏的“黑天鵝”,做著和家庭氣質完全不吻合的科技事業。
小時候在父母的玩具店裏瘋玩,小小年紀的哈薩比斯從那些五花八門的玩具和遊戲中汲取營養,甚至自己創造一些玩具和遊戲規則帶領弟弟妹妹一起玩,“我就是這麽學會遊戲設計的”!所以,也許“創造”一個天才的做法是容許他自由地從生活裏的點點滴滴中汲取營養,“野蠻生長”。
4歲時,哈薩比斯對父親和舅舅玩的國際象棋産生了興趣,很平常的生活小事在他身上卻變成了一段傳奇故事:在愛因斯坦剛把說話學利索的年齡,他卻只用兩周時間學下國際象棋就贏了大人。之後他就一路開挂,5歲開始參加英國國內比賽,6歲贏得倫敦8歲以下錦標賽冠軍,9歲成爲當時象棋領域世界第二的英國的11歲以下國家象棋隊隊長,之後于13歲時修煉成爲他所在年齡段內世界排名第二的象棋大師。
因爲表現太過出色,他被“互聯網之父”、英國計算機科學家蒂姆·伯納斯·李評價爲是“這個星球上最聰明的人之一”。喜歡深思和內省是哈薩比斯根植在血液裏的特點,“下象棋需要深思熟慮,你必須有意識地進行全盤規劃,這個過程讓人很著迷”。
8歲時,哈薩比斯用參加象棋比賽贏得的200英鎊給自己買了人生中第一台計算機,對一般小孩兒來說,這只會是個特別一點的大玩具,但對哈薩比斯來說,這卻是一個通向新世界的過道。父親某次帶他去倫敦最大的書店Foyles看書的時候,一本關于編程的書吸引了他。
與國際象棋“更像是一種訓練”,提升的只是諸多技能相比,編程的“深邃”更能吸引哈薩比斯。在鍵盤和棋盤上縱橫馳騁的8歲小孩兒思考的卻是兩個和他的年齡完全不相稱的高難度問題:一是大腦是如何學習和完成複雜任務的;二是電腦是否也能做同樣的事。
“電腦的神奇之處在于可以編程,這讓我能夠盡情釋放我的創造力”,在反複編程的過程中,哈薩比斯對計算機的認識更加深入了,他覺得計算機是一個像飛機、火車一樣重要的發明,是能夠擴展人類腦力的工具,之後他又買了一台新電腦並將其拆開來仔細研究。
很快哈薩比斯便編寫出了一款自己的計算機遊戲。作爲一個天才,哈薩比斯的最大特點是對新事物的好奇心永無止境。在“征服”計算機編程之後,11歲時他又接觸了AI,並把其用到自己編寫的遊戲中。他編的一個黑白棋遊戲的程序竟然戰勝了他弟弟。
此後電腦編程和AI就成了他生活的重要組成部分,像磁鐵一樣牢牢吸引著他。厲害的是,這樣深度沉迷的興趣愛好並沒影響他的學業,14歲時哈薩比斯提前兩年完成了類似中國中學會考的考試GCSE,15歲時他的數學水平達到A level,16歲時高等數學、物理和化學都達到了A level,這一年他考入了劍橋大學計算機科學專業,因爲年齡太小,劍橋建議他休息一年。
所以,17歲時哈薩比斯到英國的一家遊戲工作室工作,師從傳奇遊戲設計師彼得·莫利紐克斯。在這裏他開發了首款引入AI元素的電子遊戲“ThemePark”,這款遊戲銷售百萬份,不僅讓哈薩比斯獲得了足夠的資金來完成學業,還讓他堅定AI必將取得驚人發展的信念。
1994年,哈薩比斯開始在劍橋大學學習計算機科學。盡管是在人人豔羨的高校學習當時最前沿的學科,但哈薩比斯卻覺得劍橋大學本科生只能學習AI如何去執行具體的任務,這樣的“狹義AI”遠遠不夠,他對開發涉足範圍更廣的“通用AI”更感興趣,這爲後來埋下了伏筆。
在劍橋大學的4年間,哈薩比斯還接觸並迷上了古老的東方智力競技遊戲——圍棋。1997年,20歲的哈薩比斯以極爲少見的雙重一級榮譽學位(adouble first-class honours degree)從劍橋皇後學院畢業,然後創建了自己的電子遊戲公司Elixir,爲包括微軟在內的全球發行商創造遊戲。
Elixir在高峰期曾雇用過60人,制作了獲得英國電影和電視藝術學院獎提名的AI模擬遊戲如“共和國:革命”和“邪惡天才”等,公司估值最高時爲1200萬英鎊。然而,正當公司大火之時,恃才任性的哈薩比斯卻覺得自己知識不夠用,要回學校讀書去。
于是2005年他到倫敦大學學院(UCL)就學,在那裏進行關于大腦海馬體和情景記憶的前沿學術研究,完成4年認知神經科學的學習後獲得了博士學位。
哈薩比斯早年的這些經曆,不管是國際象棋還是編程,哪一項單獨拿出來都是別人難以望其項背的成就,但于他而言不過都是輕舉輕放。這不得不讓人感慨天才確實不同凡響、有才任性,同時也不得不承認,“人生沒有白走的路,每一步都算數”,因爲他前面所走的每一步都和他日後取得的舉世矚目的成就息息相關。
AlphaGo之父
圍棋因爲具有依賴直覺、需要策略性思考等特點,一直以來被看成是一個計算機很難攻克的遊戲。記住棋子位置組合、評估棋盤局勢、思考決定和執行贏棋的策略對于那時的計算機來說具有很大的難度,AI科學家們一直試圖把AI元素帶入圍棋遊戲,但研究了幾十年都無法突破。
在大學期間,哈薩比斯第一次接觸圍棋就被這個人類開發的最複雜的遊戲之一深深吸引了。1997年,超級電腦“深藍”戰勝國際象棋的世界冠軍卡斯帕羅夫之時,他就想著將來自己一定要爲圍棋寫一個程序來打敗全人類的圍棋手。
上大學時,因爲對圍繞“狹義AI”的教學課程有所質疑,哈薩比斯一次在課堂上對身邊的朋友們說老師是在“給我們洗腦”,被老師逐出教室,這讓他更堅定了以後自己要創辦一家研究AI的公司的想法。
這些植根于遙遠的大學時代的夢想終于在2011年哈薩比斯離開大學十幾年後得以實現。這一年,哈薩比斯和發小一起創立了以“解決智能,使世界變得更美好”爲理念的DeepMind公司。哈薩比斯把從象棋、圍棋等智力競技遊戲中學到的規劃思維運用到創業中,“在當時我就意識到這將是一個20年的計劃”。
當時霍金和馬斯克這兩位科技界大佬成立了反AI聯盟來共同反對AI的研究。早就認定AI必將取得驚人發展的哈薩比斯決定去說服霍金,在與這個心系全宇宙的科學家促膝長談了4個小時之後,終于讓他相信了AI將會讓世界變得更美好,並對哈薩比斯的相關研究表示關注和支持。
而馬斯克則成了哈薩比斯公司的早期投資人,他曾評價DeepMind:“它讓我對事情發展的速度有了更清晰的了解,事情的發展速度正在加快且遠遠快于人們能夠意識到的。也許你家的Roomba或其他什麽會走動,但它不會接管世界。”
與其他科技類初創公司不同,DeepMind開發的是一種叫作“深度學習”的混合了來自神經科學和機器學習的研究和專業知識複雜的自學習算法,可以在給定數據集面前自我學習、勝任特定任務。2013年12月,成立僅4年、團隊不到20人,沒有任何具體産品問世的DeepMind通過一款新軟件震驚了全球。
在機器學習研究大會上的演示中,這款軟件通過不斷試錯、不斷學習找出得分的玩法,在雅達利三款經典遊戲——乒乓、打磚塊和摩托大戰的試玩過程中表現優異,其從零開始學習並能掌握複雜任務的能力讓人們驚歎並爲之點贊。
谷歌看完這個演示後當即以4億英鎊(約6.6億美元)的價格收購了DeepMind,成爲當時歐洲規模最大的一筆收購。拉裏佩奇不僅對哈薩比斯贊不絕口,更稱Deepmind的技術爲“長久以來我見過的最令人興奮的事件之一”。
被谷歌收購後,哈薩比斯與他的團隊仍然爭取到了極大的自主權,不僅公司辦公地點仍保持在倫敦,還把自己構想中結合人腦神經元與大數據的AI圍棋項目命名爲AlphaGo。在這之後,AI在圍棋遊戲上的進展勢如破竹
2016年1月,DeepMind宣布AlphaGo攻克了圍棋並正式挑戰人類棋手。3月,AlphaGo打敗了世界頂級圍棋手李世石,這個消息讓全世界都爲之沸騰,就連哈薩比斯自己都表示“很震驚”,驚訝于AlphaGo居然有自己的棋路。從那時開始,AI將取代人類的聲音不絕于耳。
初戰告捷之後,哈薩比斯對AlphaGo進行架構升級。2016年末2017年初,AlphaGo在中國棋類網站上以“大師”(Master)爲注冊賬號,在弈城圍棋網和野狐圍棋網上與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績。
2017年5月,在中國烏鎮圍棋峰會上,AlphaGo與排名世界第一的世界圍棋冠軍柯潔對戰,再次輕松獲勝。至此,圍棋界公認AlphaGo的棋力已經超過人類職業圍棋頂尖水平。與柯潔一戰之後,AlphaGo團隊宣布其將不再參加圍棋比賽。
2017年10月18日,DeepMind團隊公布了代號爲AlphaGo Zero的最強版阿爾法圍棋。哈薩比斯一直以來都想創造一個能夠像人類一樣“學習”如何玩遊戲並達到高水平的AI,在他看來,AlphaGo並非人們認爲的“機器”,“就好像和人類一起探索宇宙的哈勃望遠鏡一樣,AlphaGo是和我們一起探索圍棋的哈勃”。
他一直極其堅定地相信AI能夠幫助人類以更快速度取得更大突破。像哈薩比斯這類“謝耳朵”型男生通常都做事專注認真但木讷、不善溝通,但哈薩比斯的難能可貴之處就在于他在帶領團隊的過程中還培養了在多種環境下工作的能力並逐漸成長爲善于表達的溝通者。
他經常以深入淺出的方式向大衆介紹自己複雜的工作以及這些工作有何重要意義。他娓娓道來地去分解描述DeepMind是如何把傳統AI技術和新技術進行結合的,比如在圍棋上,DeepMind結合了傳統“樹搜索”的方法和模擬大腦神經元的“深度神經網絡”,並巧妙地融合了多種不同的AI技術。
他曾在做客BBC時講到,在AI領域深度學習和強化學習是最讓他興奮的兩件事,前者用于識別,後者用于決策,AlphaGo就是兩者結合的産物。DeepMind將采用處理長期規劃的更深層次的強化學習技術引入AlphaGo中,而不是簡單地采用預編程系統按既定步驟下棋。
依靠增強學習系統,AlphaGo可以汲取人類棋手比賽的營養,然後開創自己的打法。未來DeepMind還將整合記憶等其他功能,“將所有這些不同領域整合在一起是關鍵。因爲我們感興趣的算法能夠將針對某一領域的學習經驗應用至新的領域”。
新技術的引進使得AlphaGo Zero能力卓越,與同類程序對弈勝率高達99.8%。能夠達成這樣的結果除了新技術的原因,還源于哈薩比斯對“智力(Mind)”的認知,“AlphaGo以人類的方式去下棋。它也是按照人類的方式去學習的,像你和我一樣,在不斷練習中技能得以提高”。
曾經擊敗國際象棋冠軍的深藍,需要國際象棋大師和程序員組成團隊來教它下棋的技巧。不斷進化的AlphaGo Zero,就像一個初生的嬰兒,在圍棋世界裏面對既定規則和要贏的目標,先學習走路,在無數次自我對抗中完善自我理解與認知,産生了直覺。慢慢地,它不僅能掌握人類大師下棋的技能,還會自己發展出一些新的技能,並用這些技能摧毀人類智慧的壁壘。
隨著AlphaGo變得聲名卓著,哈薩比斯也獲得了許多榮譽,包括“亞洲獎”年度科技最佳貢獻獎、英國皇家學會頒發的“穆拉德獎”(Mullard Award)、Nature雜志評選的“年度十大人物”、《時代》提名的全球最具影響力100人等等。
堅持探索通用AI
哈薩比斯給自己設定的終極目標是理解時間、黑洞以及人類在整個宇宙中的真正地位,通用AI是他到達這一星辰大海的途徑。讀博時,哈薩比斯就開始尋求在人類大腦中尋找新的AI算法的靈感了。
2007年,他發現5位失憶症患者因爲海馬體受損而很難想象未來,這證明了大腦中以往被認爲只與過去有關的部分對于規劃未來也至關重要。這些年,在AlphaGo獲得了不起的成功的同時,哈薩比斯堅持對通用AI的探索,帶領DeepMind做了很多大事:
2016年底,DeepMind開源了其核心深度學習平台之一“DeepMind Lab”供研究人員和開發者使用。這是一套爲玩遊戲的智能機器人打造的娛樂學習遊戲平台。開源之後,全世界的研究人員和開發者都可以在上面發揮才智,爲AI發展群策群力。
同一時間,DeepMind還公布了一台“可微分神經計算機”(DNC),簡單理解就是這台機器既能像人類一樣思考,又能像計算機一樣進行高速運算和記憶數據,使得“機器”向“人”更邁進了一步。
爲了讓“機器”更像“人”,DeepMind在圖像生成和語音生成領域也有超前研究,其2016年公布的語音生成系統WaveNet據稱將計算機輸出音頻與人類自然語音差距縮小了50%。
醫療是哈薩比斯強調的AI需要落地的領域。DeepMind Health是智能醫療系統,其根據與英國全國醫療系統合作獲取的數據打造基于AI的診療和症狀判斷幫助;Alpha Fold能根據基因序列來預測蛋白質的3D結構,在有“蛋白質結構預測奧運會”之稱的CASP比賽中力壓其他97個參賽者奪冠,爲醫療領域變革、新藥物研發奠定了理論基礎。
DeepMind還運用AI系統優化了冷卻系統的用電效率,據說一次性幫谷歌節省了上億美金的開銷。2018年底,Alpha Zero只用一個算法就在圍棋、國際象棋和將棋三個領域奠定了霸主地位,並因此登上了《科學》封面,被評價“能夠解決多個複雜問題的單一算法是創建通用機器學習系統,解決實際問題的重要一步”。
打造通用AI並不容易,DeepMind另辟蹊徑,從現實生活中獲得靈感,把解決方案提煉總結爲“在許多不同的可能組合中選擇正確的路徑”。他認爲,在可以預見的將來,AI會像科學家一樣工作,提出假設並設計實驗來驗證假設,然後“取得可能獲得諾貝爾獎的重大突破”。
爲了推進通用AI發展進程,哈薩比斯甚至還非常少見地親手寫下長篇文章,發表在神經醫學界的頂級刊物《神經》中,提出“假如我們的目標是開發出接近或同等于人類智慧的智能技術,那麽就絕不能放棄對人腦的研究和理解,因爲人腦是唯一能夠證明這種智慧存在的證據”的鮮明觀點。
目前DeepMind主要專注于兩方面的研究,一個是對前面提到的強化學習的深度探索,可能會與機器決策、物理世界處理等AI領域的技術相結合;另一個是AI可解釋性,既用心理學和神經科學來破解AI黑箱,同時也希望用強化學習等“AI原理”幫助探秘人類大腦。
這些研究的重要意義不在于得到了什麽具體成果,而在于給跨學科研究做出了紮實的示範,證明了神經學補全AI的可行性,其非常關鍵的機器心智理論可能會成爲主流研究方向。
而且,哈薩比斯認爲,不僅AI需要向神經科學學習,對人類大腦與神經的研究今天也需要向AI學習。用強化學習機制來解釋人腦的運作模式被實驗證明解釋是正確的,那麽對人類大腦機制的研究與模仿應該也可以加強對強化學習技術的理解和升級。
未來與記憶相關的AI技術或將成爲DeepMind的研究重點,情景記憶、工作記憶、長期學習等技術很有可能成爲突破方向。哈薩比斯的暢想是:通過AI來了解人類智慧,讓AI與人類大腦形成比對,或許可能“對人類心靈中一些最深刻和最持久的奧秘如創造力、夢想等産生深刻的見解,甚至能觸及意識的本質”。
天才領導者和生活裏的普通人
作爲企業家的哈薩比斯領導著Deepmind一個包括400名博士的共700名員工的團隊。被谷歌收購後,熱愛自己家鄉的哈薩比斯不願搬遷,“我在北倫敦出生並長大,非常喜歡這座城市。倫敦沒有任何理由無法容納一家世界級的AI研究機構。我很驕傲我們能留在這裏。”
DeepMind辦公樓的所有房間都以人類史上的天才來命名:特斯拉、拉馬努詹、柏拉圖、費曼、亞裏士多德、居裏夫人等。辦公環境是最有利于人們發揮創造力的設計,大樓的一樓有咖啡廳、有帶冰箱的會客室、桌上有足球遊戲機。樓頂是一個可以看到倫敦美好風景的露天平台,每周五晚上員工們在那裏舉辦聚會。
公司彙聚了全世界最優秀的人才,類似波蘭物理奧賽的冠軍或者法國頂級的數學博士等,他們都看起來健康、愉快、酷,空氣中彷佛都彌漫著知識的味道。哈薩比斯花很多時間思考“DeepMind作爲一種算法的效率”,他堅信自己能把事情做得更出色,因爲公司融合了最優秀的學術氛圍和最令人興奮的創業文化。
這樣的環境和氛圍使得即使在谷歌最大的競爭對手大舉挖人之時,DeepMind的員工離職率也爲0。作爲公認的天才的哈薩比斯,並非電影裏那種瘋狂地企圖做出一件轟動人類大事的科學家,或者生活中常見的表面木讷、內心狂野的“極客”,他很接地氣。
和絕大多數普通人一樣,他在該結婚的年齡成了家,妻子是一名意大利的分子生物學家,專注于阿茲海默症的研究。他們育有兩個兒子,分別擅長科學和創造性活動。與絕大多數人的不同之處在于,哈薩比斯一天之內有兩個工作日。
他上午十點左右到辦公室協調、溝通、決策,引導公司保持世界領先地位。然後在晚上7點半搭乘地鐵准時回到距離他兒時生活地點不遠的家中,陪伴家人進餐,與孩子們一同遊戲、讀書或是幫他們完成家庭作業。在把兩個孩子哄睡之後,他重新開始工作至淩晨一點,之後用幾個小時來進行深度思考,直至淩晨四點入眠。
那些震驚世人的想法都是來自深夜的思考。“完全是個超人”的哈薩比斯認爲工作和生活“是同一塊畫布的不同部分”,他閱讀、看電影、聽音樂,但最終還是會回到工作上,變成他思考問題的引子。“在我醒來的每個時刻,工作都是我思考的問題,或許在夢裏也是如此,這也是我最有熱情的一件事。”
哈薩比斯談到工作時的樣子能夠讓你相信工作真的是一件最有趣的事,“我感覺非常幸運,每個時刻我都在做自己真正堅信的事。否則,生命那麽短暫,爲何要去做這些?”所謂天才,其實很大的部分來自于專注。
更多精彩內容,關注钛媒體微信號(ID:taimeiti),或者下載钛媒體App