AlphaGo之父戴密斯·哈薩比斯 天才領(lǐng)導(dǎo)者和生活里的普通人
2017年10月18日,DeepMind團隊公布了代號為AlphaGo Zero的最強版阿爾法圍棋。哈薩比斯一直以來都想創(chuàng)造一個能夠像人類一樣“學(xué)習(xí)”如何玩游戲并達到高水平的AI,在他看來,AlphaGo并非人們認(rèn)為的“機器”,“就好像和人類一起探索宇宙的哈勃望遠(yuǎn)鏡一樣,AlphaGo是和我們一起探索圍棋的哈勃”。
他一直極其堅定地相信AI能夠幫助人類以更快速度取得更大突破。像哈薩比斯這類“謝耳朵”型男生通常都做事專注認(rèn)真但木訥、不善溝通,但哈薩比斯的難能可貴之處就在于他在帶領(lǐng)團隊的過程中還培養(yǎng)了在多種環(huán)境下工作的能力并逐漸成長為善于表達的溝通者。
他經(jīng)常以深入淺出的方式向大眾介紹自己復(fù)雜的工作以及這些工作有何重要意義。他娓娓道來地去分解描述DeepMind是如何把傳統(tǒng)AI技術(shù)和新技術(shù)進行結(jié)合的,比如在圍棋上,DeepMind結(jié)合了傳統(tǒng)“樹搜索”的方法和模擬大腦神經(jīng)元的“深度神經(jīng)網(wǎng)絡(luò)”,并巧妙地融合了多種不同的AI技術(shù)。
他曾在做客BBC時講到,在AI領(lǐng)域深度學(xué)習(xí)和強化學(xué)習(xí)是最讓他興奮的兩件事,前者用于識別,后者用于決策,AlphaGo就是兩者結(jié)合的產(chǎn)物。DeepMind將采用處理長期規(guī)劃的更深層次的強化學(xué)習(xí)技術(shù)引入AlphaGo中,而不是簡單地采用預(yù)編程系統(tǒng)按既定步驟下棋。
依靠增強學(xué)習(xí)系統(tǒng),AlphaGo可以汲取人類棋手比賽的營養(yǎng),然后開創(chuàng)自己的打法。未來DeepMind還將整合記憶等其他功能,“將所有這些不同領(lǐng)域整合在一起是關(guān)鍵。因為我們感興趣的算法能夠?qū)⑨槍δ骋活I(lǐng)域的學(xué)習(xí)經(jīng)驗應(yīng)用至新的領(lǐng)域”。
新技術(shù)的引進使得AlphaGo Zero能力卓越,與同類程序?qū)膭俾矢哌_99.8%。能夠達成這樣的結(jié)果除了新技術(shù)的原因,還源于哈薩比斯對“智力(Mind)”的認(rèn)知,“AlphaGo以人類的方式去下棋。它也是按照人類的方式去學(xué)習(xí)的,像你和我一樣,在不斷練習(xí)中技能得以提高”。
曾經(jīng)擊敗國際象棋冠軍的深藍,需要國際象棋大師和程序員組成團隊來教它下棋的技巧。不斷進化的AlphaGo Zero,就像一個初生的嬰兒,在圍棋世界里面對既定規(guī)則和要贏的目標(biāo),先學(xué)習(xí)走路,在無數(shù)次自我對抗中完善自我理解與認(rèn)知,產(chǎn)生了直覺。慢慢地,它不僅能掌握人類大師下棋的技能,還會自己發(fā)展出一些新的技能,并用這些技能摧毀人類智慧的壁壘。
隨著AlphaGo變得聲名卓著,哈薩比斯也獲得了許多榮譽,包括“亞洲獎”年度科技最佳貢獻獎、英國皇家學(xué)會頒發(fā)的“穆拉德獎”(Mullard Award)、Nature雜志評選的“年度十大人物”、《時代》提名的全球最具影響力100人等等。
堅持探索通用AI
哈薩比斯給自己設(shè)定的終極目標(biāo)是理解時間、黑洞以及人類在整個宇宙中的真正地位,通用AI是他到達這一星辰大海的途徑。讀博時,哈薩比斯就開始尋求在人類大腦中尋找新的AI算法的靈感了。
2007年,他發(fā)現(xiàn)5位失憶癥患者因為海馬體受損而很難想象未來,這證明了大腦中以往被認(rèn)為只與過去有關(guān)的部分對于規(guī)劃未來也至關(guān)重要。這些年,在AlphaGo獲得了不起的成功的同時,哈薩比斯堅持對通用AI的探索,帶領(lǐng)DeepMind做了很多大事:
2016年底,DeepMind開源了其核心深度學(xué)習(xí)平臺之一“DeepMind Lab”供研究人員和開發(fā)者使用。這是一套為玩游戲的智能機器人打造的娛樂學(xué)習(xí)游戲平臺。開源之后,全世界的研究人員和開發(fā)者都可以在上面發(fā)揮才智,為AI發(fā)展群策群力。
同一時間,DeepMind還公布了一臺“可微分神經(jīng)計算機”(DNC),簡單理解就是這臺機器既能像人類一樣思考,又能像計算機一樣進行高速運算和記憶數(shù)據(jù),使得“機器”向“人”更邁進了一步。
為了讓“機器”更像“人”,DeepMind在圖像生成和語音生成領(lǐng)域也有超前研究,其2016年公布的語音生成系統(tǒng)WaveNet據(jù)稱將計算機輸出音頻與人類自然語音差距縮小了50%。
醫(yī)療是哈薩比斯強調(diào)的AI需要落地的領(lǐng)域。DeepMind Health是智能醫(yī)療系統(tǒng),其根據(jù)與英國全國醫(yī)療系統(tǒng)合作獲取的數(shù)據(jù)打造基于AI的診療和癥狀判斷幫助;Alpha Fold能根據(jù)基因序列來預(yù)測蛋白質(zhì)的3D結(jié)構(gòu),在有“蛋白質(zhì)結(jié)構(gòu)預(yù)測奧運會”之稱的CASP比賽中力壓其他97個參賽者奪冠,為醫(yī)療領(lǐng)域變革、新藥物研發(fā)奠定了理論基礎(chǔ)。
DeepMind還運用AI系統(tǒng)優(yōu)化了冷卻系統(tǒng)的用電效率,據(jù)說一次性幫谷歌節(jié)省了上億美金的開銷。2018年底,Alpha Zero只用一個算法就在圍棋、國際象棋和將棋三個領(lǐng)域奠定了霸主地位,并因此登上了《科學(xué)》封面,被評價“能夠解決多個復(fù)雜問題的單一算法是創(chuàng)建通用機器學(xué)習(xí)系統(tǒng),解決實際問題的重要一步”。
打造通用AI并不容易,DeepMind另辟蹊徑,從現(xiàn)實生活中獲得靈感,把解決方案提煉總結(jié)為“在許多不同的可能組合中選擇正確的路徑”。他認(rèn)為,在可以預(yù)見的將來,AI會像科學(xué)家一樣工作,提出假設(shè)并設(shè)計實驗來驗證假設(shè),然后“取得可能獲得諾貝爾獎的重大突破”。
為了推進通用AI發(fā)展進程,哈薩比斯甚至還非常少見地親手寫下長篇文章,發(fā)表在神經(jīng)醫(yī)學(xué)界的頂級刊物《神經(jīng)》中,提出“假如我們的目標(biāo)是開發(fā)出接近或同等于人類智慧的智能技術(shù),那么就絕不能放棄對人腦的研究和理解,因為人腦是唯一能夠證明這種智慧存在的證據(jù)”的鮮明觀點。
目前DeepMind主要專注于兩方面的研究,一個是對前面提到的強化學(xué)習(xí)的深度探索,可能會與機器決策、物理世界處理等AI領(lǐng)域的技術(shù)相結(jié)合;另一個是AI可解釋性,既用心理學(xué)和神經(jīng)科學(xué)來破解AI黑箱,同時也希望用強化學(xué)習(xí)等“AI原理”幫助探秘人類大腦。
這些研究的重要意義不在于得到了什么具體成果,而在于給跨學(xué)科研究做出了扎實的示范,證明了神經(jīng)學(xué)補全AI的可行性,其非常關(guān)鍵的機器心智理論可能會成為主流研究方向。
而且,哈薩比斯認(rèn)為,不僅AI需要向神經(jīng)科學(xué)學(xué)習(xí),對人類大腦與神經(jīng)的研究今天也需要向AI學(xué)習(xí)。用強化學(xué)習(xí)機制來解釋人腦的運作模式被實驗證明解釋是正確的,那么對人類大腦機制的研究與模仿應(yīng)該也可以加強對強化學(xué)習(xí)技術(shù)的理解和升級。
未來與記憶相關(guān)的AI技術(shù)或?qū)⒊蔀镈eepMind的研究重點,情景記憶、工作記憶、長期學(xué)習(xí)等技術(shù)很有可能成為突破方向。哈薩比斯的暢想是:通過AI來了解人類智慧,讓AI與人類大腦形成比對,或許可能“對人類心靈中一些最深刻和最持久的奧秘如創(chuàng)造力、夢想等產(chǎn)生深刻的見解,甚至能觸及意識的本質(zhì)”。
天才領(lǐng)導(dǎo)者和生活里的普通人
作為企業(yè)家的哈薩比斯領(lǐng)導(dǎo)著Deepmind一個包括400名博士的共700名員工的團隊。被谷歌收購后,熱愛自己家鄉(xiāng)的哈薩比斯不愿搬遷,“我在北倫敦出生并長大,非常喜歡這座城市。倫敦沒有任何理由無法容納一家世界級的AI研究機構(gòu)。我很驕傲我們能留在這里。”
DeepMind辦公樓的所有房間都以人類史上的天才來命名:特斯拉、拉馬努詹、柏拉圖、費曼、亞里士多德、居里夫人等。辦公環(huán)境是最有利于人們發(fā)揮創(chuàng)造力的設(shè)計,大樓的一樓有咖啡廳、有帶冰箱的會客室、桌上有足球游戲機。樓頂是一個可以看到倫敦美好風(fēng)景的露天平臺,每周五晚上員工們在那里舉辦聚會。
公司匯聚了全世界最優(yōu)秀的人才,類似波蘭物理奧賽的冠軍或者法國頂級的數(shù)學(xué)博士等,他們都看起來健康、愉快、酷,空氣中彷佛都彌漫著知識的味道。哈薩比斯花很多時間思考“DeepMind作為一種算法的效率”,他堅信自己能把事情做得更出色,因為公司融合了最優(yōu)秀的學(xué)術(shù)氛圍和最令人興奮的創(chuàng)業(yè)文化。
這樣的環(huán)境和氛圍使得即使在谷歌最大的競爭對手大舉挖人之時,DeepMind的員工離職率也為0。作為公認(rèn)的天才的哈薩比斯,并非電影里那種瘋狂地企圖做出一件轟動人類大事的科學(xué)家,或者生活中常見的表面木訥、內(nèi)心狂野的“極客”,他很接地氣。
和絕大多數(shù)普通人一樣,他在該結(jié)婚的年齡成了家,妻子是一名意大利的分子生物學(xué)家,專注于阿茲海默癥的研究。他們育有兩個兒子,分別擅長科學(xué)和創(chuàng)造性活動。與絕大多數(shù)人的不同之處在于,哈薩比斯一天之內(nèi)有兩個工作日。
他上午十點左右到辦公室協(xié)調(diào)、溝通、決策,引導(dǎo)公司保持世界領(lǐng)先地位。然后在晚上7點半搭乘地鐵準(zhǔn)時回到距離他兒時生活地點不遠(yuǎn)的家中,陪伴家人進餐,與孩子們一同游戲、讀書或是幫他們完成家庭作業(yè)。在把兩個孩子哄睡之后,他重新開始工作至凌晨一點,之后用幾個小時來進行深度思考,直至凌晨四點入眠。
那些震驚世人的想法都是來自深夜的思考。“完全是個超人”的哈薩比斯認(rèn)為工作和生活“是同一塊畫布的不同部分”,他閱讀、看電影、聽音樂,但最終還是會回到工作上,變成他思考問題的引子。“在我醒來的每個時刻,工作都是我思考的問題,或許在夢里也是如此,這也是我最有熱情的一件事。”
哈薩比斯談到工作時的樣子能夠讓你相信工作真的是一件最有趣的事,“我感覺非常幸運,每個時刻我都在做自己真正堅信的事。否則,生命那么短暫,為何要去做這些?”所謂天才,其實很大的部分來自于專注。
關(guān)鍵詞: 哈薩比斯
責(zé)任編輯:hnmd004
- 鬼哭狼嚎是貶義詞嗎?暴跳如雷是貶義詞嗎?2023-06-14
- 公積金卡和工資卡可以是一張嗎?公積金可以2023-06-14
- 每日聚焦:追星的人是什么心態(tài)?追星有什么2023-06-14
- 茶黃金是什么東西?大紅袍屬于哪個茶類? 2023-06-14
- 什么是名義利率? 名義利率和實際2023-06-14
- 天天消息!tp-link路由器怎么樣?tp-link路2023-06-14
- 大盤股和板塊股的區(qū)別是什么?大盤股上市對2023-06-14
- 怎么買一個合適的外接閃光燈?使用外接式閃2023-06-14
- 計算機啟動修復(fù)要多久?啟動修復(fù)可以強制2023-06-14
- 每日消息!電腦顯卡風(fēng)扇轉(zhuǎn)速怎么調(diào)?怎么在B2023-06-14
- 纖體咖啡有副作用嗎?咖啡喝多了對身體有什2023-06-14
- 基金清盤是不是賠慘了?基金一直跌會被清盤2023-06-14
- 美股的錢怎么轉(zhuǎn)回國內(nèi)?為什么中國人不能買2023-06-14
- 購買空氣炸鍋需要注意哪些問題?如何清潔空2023-06-14
- 中國農(nóng)業(yè)大學(xué)是211還是985?農(nóng)業(yè)大學(xué)是冷門2023-06-14
- 焦點滾動:澳大利亞主帥:世界杯前43分鐘成2023-06-14
- 雞蛋怎么孵化成小雞?人工孵雞蛋最簡單的方2023-06-14
- 6月13日四川發(fā)布山洪災(zāi)害藍色預(yù)警2023-06-14
- 五月天是什么時候出道的?五月天哪首歌曲最2023-06-14
- 天天熱點評!電競顯示器怎么選?哪個電競顯2023-06-14
- 股票為什么會產(chǎn)生異常波動?尾盤拉升第二天2023-06-14
- 勞動法年假規(guī)定怎么休?勞動法年假補償標(biāo)準(zhǔn)2023-06-14
- win10怎么取消開機密碼?win10密碼過期進不2023-06-14
- 如何升級客戶端版本?手機客戶端怎么打開?2023-06-14
- 世界快看點丨WIN10右下角天氣怎么關(guān)?win102023-06-14
- 喝咖啡不能提神怎么回事?喝咖啡一次喝多少2023-06-14
- 清倉和半倉有什么區(qū)別?北交所中簽100股能賺2023-06-14
- 申購新股最多可以配多少個號?新股申購配號2023-06-14
- 環(huán)球視訊!提前還車貸會影響征信嗎?車貸提2023-06-14
- 內(nèi)馬爾和姆巴佩誰才是球隊老大?內(nèi)馬爾和梅2023-06-14
精彩推薦
閱讀排行
-
“泉州港”改名被疑瞎折騰 泉州人很難接受
下一篇2021-01-06 15:41:08
-
國家旅游局提示赴韓國旅游風(fēng)險 慎重選擇旅游目的地
上一篇2021-01-06 14:55:22