揭秘AlphaGo背后團(tuán)隊(duì):人工智能的下一個(gè)目標(biāo)是什么?
來源: 一財(cái)網(wǎng)作者: 一財(cái)網(wǎng)
攻克圍棋,僅僅是AlphaGo背后Deepmind團(tuán)隊(duì)的第一步。
近日,Deepmind創(chuàng)始人Demis Hassabis在接受The Verge采訪時(shí)透露, AlphaGo僅僅是谷歌人工智能項(xiàng)目的一個(gè)分支。在未來,Deepmind主要目的是“用人工智能解決一切問題”,并將進(jìn)一步探索人工智能在醫(yī)療、機(jī)器人以及手機(jī)等多個(gè)領(lǐng)域的應(yīng)用。
回溯Demis Hassabis的成功之路,從一個(gè)獲得過5次智力奧林匹克冠軍的國(guó)際象棋神童,到兩科優(yōu)等成績(jī)獲得劍橋大學(xué)計(jì)算機(jī)科學(xué)學(xué)位的青少年,再到創(chuàng)造了第一款包含人工智能的視頻游戲《主題公園》并創(chuàng)立了開創(chuàng)性的視頻游戲公司Elixir1,之后離開游戲產(chǎn)業(yè)深造神經(jīng)科學(xué)的PhD學(xué)位后于2010年創(chuàng)立Deepmind團(tuán)隊(duì),你會(huì)發(fā)現(xiàn)他的經(jīng)歷十分與眾不同。
Hassabis接受The Verge采訪時(shí)正值AlphaGo首勝李世石九段的次日清早,如果說這個(gè)時(shí)候他把來自媒體的追問拋到九霄云外似乎也無可厚非。然而他卻依舊熱情友好,當(dāng)Google方面的代表告訴Hassabis一夕之間有超過3300篇韓國(guó)媒體關(guān)于他的采訪時(shí),Hassabis表示出了明顯的詫異:“這真是難以置信,不過看到一個(gè)高深莫測(cè)的東西在短時(shí)間內(nèi)變得如此受歡迎,還是一件有趣的事情?!?/span>
圍棋將是永恒的圣杯
據(jù)Hassabis稱:“圍棋一直位于完美信息游戲的頂峰之處,在可能性方面圍棋比國(guó)際象棋復(fù)雜得多,所以,尤其是在深藍(lán)之后,圍棋對(duì)于人工智能來說意味著可望而不可及的圣杯。盡管我們做出了很多的努力,但仍舊沒有特別深入的領(lǐng)悟圍棋。蒙特卡羅樹搜索可以說是十年前的一項(xiàng)重大革新,但是我認(rèn)為對(duì)于AlphaGo的研發(fā)更為重要的部分在于我們引入了深度神經(jīng)網(wǎng)使得人工智能擁有了所謂的直覺方面的判斷力??梢哉f好的直覺是令頂尖棋手出類拔萃的關(guān)鍵原因,在昨天的比賽的實(shí)時(shí)解說中,當(dāng)我看到麥克雷蒙九段在計(jì)算結(jié)果方面表示很難判斷的時(shí)候,再次感到寫出一套圍棋價(jià)值判斷的程序極其困難。
此外,對(duì)于AlphaGo在實(shí)戰(zhàn)過程中下出的一些出其不意的招數(shù),Hassabis表示十分震驚:“我相信李世石也會(huì)是同樣的感覺,從他的面部表情上面可以觀察出來,當(dāng)AlphaGo向左進(jìn)擊李世石的領(lǐng)域時(shí),我承認(rèn)這的確出人意料。”同時(shí)他也認(rèn)為,AlphaGo的下法極具進(jìn)攻性,在某種程度上來說,AlphaGo在用李世石的長(zhǎng)項(xiàng)來進(jìn)行對(duì)抗。Hassabis說:“李世石以奇招頻出和善于把控局勢(shì)聞名,可以說AlphaGo在第一場(chǎng)比賽中下出了我們想要看到的局面,在開始的時(shí)候,它只是在整個(gè)棋盤上進(jìn)行布局并沒有實(shí)質(zhì)地占領(lǐng)某塊區(qū)域。傳統(tǒng)的圍棋程序之所以具有明顯的短板,是因?yàn)樗鼈兙谟?jì)算卻缺乏一種大局觀?!?/span>
為何AlphaGo的勝利意義重大
舉辦這場(chǎng)比賽的初衷在于評(píng)估AlphaGo 的能力,談及從AlphaGo的勝利中學(xué)到了什么以及未來它的發(fā)展方向,Hassabis表示:“通過比賽我們意識(shí)到我們目前所處的環(huán)節(jié)比之前預(yù)計(jì)的更加先進(jìn)。對(duì)于完美信息游戲,圍棋一直位于金字塔尖,還有許多頂級(jí)的圍棋高手等待對(duì)決。此外,還有很多其他的游戲,比如說無限制撲克,因?yàn)槭遣煌昝佬畔⒂螒?,因此多人游戲也是一個(gè)挑戰(zhàn)。顯而易見所有人類比機(jī)器玩兒的好的電子游戲也可以被考慮其中,比如說《星際爭(zhēng)霸》在韓國(guó)也是非常受歡迎的。在信息不完美世界里,策略游戲?qū)Q策能力有極高的要求,因?yàn)槟軌虮豢吹降膬H僅是全局的一部分。而在圍棋之中全盤情況都是可視的,這點(diǎn)對(duì)于電腦來說會(huì)使游戲略微容易一些?!?/span>
盡管用人工智能進(jìn)行游戲?qū)?zhàn)刺激有趣,但是Deepmind團(tuán)隊(duì)還是希望將人工智能用于更多主流的項(xiàng)目當(dāng)中。Hassabis表示他本人對(duì)游戲十分感興趣,也許是曾經(jīng)寫過游戲,但是目前來說,游戲僅僅是提供測(cè)試平臺(tái)用來測(cè)試我們的算法并且評(píng)估它們的等級(jí)的一個(gè)行之有效的辦法。而Deepmind的終極目標(biāo)在于用人工智能解決真實(shí)世界中的棘手問題。
談及自己過去從事游戲行業(yè)的經(jīng)歷對(duì)現(xiàn)在有何影響時(shí),Hassabis說:“可以說創(chuàng)立Deepmind一直以來是我的最終目的,我用了近20年籌劃這個(gè)事情,如果你從一個(gè)最終我將要從事人工智能研究的角度審視我的經(jīng)歷,你會(huì)發(fā)現(xiàn)我的每一步選擇都是朝向人工智能的,熟悉我的Bullfrog員工都知道,我寫的所有游戲的核心都是與人工智能相關(guān)的。在16歲的時(shí)候?qū)憽吨黝}公園》游戲的時(shí)候我第一次意識(shí)到如果我們?nèi)σ愿斑M(jìn)行研究,人工智能的前景不可估量。這款游戲十分暢銷,說明玩家享受其中,因?yàn)槿斯ぶ悄苁仲N合玩家的心意。因此我繼續(xù)在游戲領(lǐng)域進(jìn)行拓展,然而在2000年的時(shí)候我感覺到我們已經(jīng)在’從后門偷偷逼近‘人工智能研究的路上走到了盡頭,因?yàn)椴还茉趺礃幽愕淖罱K目標(biāo)都只是做出一款游戲,所以我轉(zhuǎn)而去學(xué)習(xí)神經(jīng)科學(xué),以期在人工智能領(lǐng)域有所進(jìn)展?!?/span>
Hassabis認(rèn)為人工智能在90年代最直觀的應(yīng)用即是體現(xiàn)在游戲行業(yè),那時(shí),學(xué)術(shù)界的研究沒有什么動(dòng)靜,一些諸如增強(qiáng)學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等新技術(shù)都沒有得到應(yīng)用與推廣,所以游戲成為人工智能最好的應(yīng)用領(lǐng)域,當(dāng)然那時(shí)的人工智能與現(xiàn)在大相徑庭,當(dāng)時(shí)的人工智能更像是較為復(fù)雜的有限狀態(tài)機(jī)(FSM),游戲Black &White中應(yīng)用到了增強(qiáng)學(xué)習(xí)技術(shù),到目前為止我仍舊認(rèn)為這是在游戲中應(yīng)用最復(fù)雜的案例。然而到了2004年左右,游戲行業(yè)發(fā)生了很大的變化,不再像90年代那樣只要你有一個(gè)不錯(cuò)的點(diǎn)子就可以做一款游戲,游戲行業(yè)變得更加注重畫面感,并且官方授權(quán)也變得十分重要,像FIFA系列游戲就是一個(gè)很好的例子。所以我認(rèn)為做游戲不再像以前那樣有趣了,并且我已經(jīng)在游戲領(lǐng)域積蓄了創(chuàng)立Deepmind所需的信息與經(jīng)驗(yàn),這個(gè)時(shí)候神經(jīng)科學(xué)引起了我的興趣,我很想從明白大腦解決問題的過程中獲得靈感,所以讀一個(gè)神經(jīng)科學(xué)的PhD再合適不過了。”
人工智能如何改變醫(yī)療領(lǐng)
人工智能的主要應(yīng)用將會(huì)在醫(yī)療、智能手機(jī)助手、機(jī)器人科學(xué)領(lǐng)域,在醫(yī)療方面,目前認(rèn)知計(jì)算系統(tǒng)IBM Watson已經(jīng)著手進(jìn)行癌癥診斷的項(xiàng)目,據(jù)此,Deepmind表示幾周之前已經(jīng)開始了和NHS(英國(guó)國(guó)家醫(yī)療服務(wù)體系)的合作,構(gòu)建一個(gè)可以應(yīng)用機(jī)器學(xué)習(xí)智能的平臺(tái)。Hassabis認(rèn)為IBM Watson所做的工作與Deepmind團(tuán)隊(duì)的工作有所區(qū)別,癌癥篩查更像是一個(gè)專家系統(tǒng),是另一種形式的人工智能,這類人工智能所能做到的是進(jìn)行圖像方面的醫(yī)學(xué)診斷,自我量化然后進(jìn)行重要特征的橫向比對(duì)以及大量的篩查,從而指導(dǎo)人們擁有更健康的生活方式,我認(rèn)為把增強(qiáng)學(xué)習(xí)技術(shù)用于這個(gè)領(lǐng)域較為適宜。
對(duì)于與NHS的合作,Deepmind推出了一款并未有用到AI或是機(jī)器學(xué)習(xí)的應(yīng)用程序,原因在于NHS軟件自身來看較為落后,它們并不是移動(dòng)端的,完全不適用于目前消費(fèi)者的使用習(xí)慣,并且對(duì)于醫(yī)生和護(hù)士來說這個(gè)軟件十分低效。所以Deepmind首先會(huì)改善可視化與基礎(chǔ)化信息,借此看清真正的需求,繼而將更加熟練的機(jī)器運(yùn)用其中。
未來核心應(yīng)用領(lǐng)域
在第一天發(fā)布會(huì)的演講中,Hassabis使用了電影《她》中的海報(bào)作為講解的背景,對(duì)此他解釋道:“關(guān)于智能手機(jī)助手的樣子,《她》是較為盛行的主流觀點(diǎn),我的看法是應(yīng)該讓智能手機(jī)助手變得更加‘人性化’,使它能夠?qū)δ愕男枨笥懈由羁痰睦斫狻6壳按蟛糠诌@樣的系統(tǒng)都極為脆弱,一旦偏離了預(yù)先編程輸入的模版,它們就會(huì)變得毫無用處?!?/span>
正如Hassabis所言,目前基本所有的智能手機(jī)助手都屬于特殊案例和預(yù)編程的,這意味著它們很脆弱,只能做預(yù)編程寫好的事。然而真實(shí)的世界非常混亂,用戶們也會(huì)在你無法提前知曉的情況下,做著不可預(yù)知的事情。所以DeepMind 的信念是:通往人工智能的唯一道路,是從地基開始打起,而且變得通用。這也是最根本的原則之一。
針對(duì)這點(diǎn)該如何改進(jìn),Hassabis的看法是:”由于智能手機(jī)的輸入十分多變,所以或許得輸入有’上萬噸’的數(shù)據(jù),才可以從中學(xué)習(xí)到很多東西。根據(jù)AlphaGo 的算法,我們打算在未來幾個(gè)月嘗試的是,擺脫監(jiān)督式學(xué)習(xí)的出發(fā)點(diǎn),讓它完全自我發(fā)揮,從一無所有的狀態(tài)開始。它會(huì)需要更長(zhǎng)的時(shí)間,因?yàn)楫?dāng)你采用隨機(jī)方法的時(shí)候,其中的審查和錯(cuò)誤會(huì)需要更多的時(shí)間訓(xùn)練,也許是幾個(gè)月。但是,我們認(rèn)為有這個(gè)可能性,讓它從純粹的學(xué)習(xí)中起步?!皩?duì)于何時(shí)才能看到人工智能給市場(chǎng)帶來顯著性差異,Hassabis給出的答案是:”我認(rèn)為在未來的兩到三年會(huì)開始看到改善。我的意思是,這些改善在開始的時(shí)候是非常微小的,只有很小的部分會(huì)工作的更好。也許在未來的4 到5 年,甚至5 年更多,你可以看到智能手機(jī)在功能上大的變化。“
為何選擇Google ?
事實(shí)上,AlphaGo 在比賽中并沒有使用那么多硬件,然而Deepmind團(tuán)隊(duì)需要大量的硬件來訓(xùn)練它,做各種不同的版本,并讓他們?cè)谠贫嘶ハ啾荣?。這需要相當(dāng)多的硬件才能高效完成,所以如果沒有這些資源,在這段時(shí)間內(nèi)根本無法完成。這也是Deepmind選擇與Google合作的原因之一。
關(guān)于是否期待被納入Google商業(yè)模式與產(chǎn)品路線圖中,Hassabis認(rèn)為:“在如何最優(yōu)化研究進(jìn)展方面,我們有很強(qiáng)的主導(dǎo)權(quán)。這是我們的使命,也是為什么我們加入了Google,這樣我們可以給研究進(jìn)行渦輪增壓。這是發(fā)生在過去幾年的事情。當(dāng)然,我們實(shí)際上也致力于很多Google 內(nèi)部的產(chǎn)品,但是他們是非常早期的階段,所以還沒準(zhǔn)備好公布。當(dāng)然我認(rèn)為智能手機(jī)助手是非常核心的,我認(rèn)為Sundar Pichai 已經(jīng)對(duì)此談了很多,這是Google 未來的核心?!?/span>
對(duì)于與Google Brain是否有合作,Hassabis表示:“其實(shí)我們是非常互補(bǔ)的。我們每周都有交談。Google Brain 主要致力于深度學(xué)習(xí),他們也有非常卓越的工程師Jeff Dean,所以他們已經(jīng)鋪開到公司的各個(gè)角落,這也是為什么我們發(fā)明出了令人驚喜的Google 圖片搜索。他們正在做著現(xiàn)象級(jí)的工作。另外,他們的團(tuán)隊(duì)在山景城,所以他們離產(chǎn)品團(tuán)隊(duì)更近,他們的研究周期也更像12 到18 個(gè)月。而我們有更多算法開發(fā)的工作,我們傾向于為需要兩三年研究的事情做研究,而且不需要在開始的時(shí)候就有直接的產(chǎn)品焦點(diǎn)?!?/span>
關(guān)注未來科學(xué)
關(guān)于機(jī)器人科學(xué)目前的發(fā)展?fàn)顩r,Hassabis認(rèn)為它們或許有漂亮的軀干,但是依然缺乏智慧的“大腦”,與智能手機(jī)助手目前的狀況相似,機(jī)器人目前似乎只能對(duì)預(yù)先進(jìn)行編程的情況作出反應(yīng),一旦處于狀況之外,機(jī)器人無疑會(huì)無所適從。因此如何通過機(jī)器學(xué)習(xí)強(qiáng)化機(jī)器人的能力十分重要。
對(duì)于科學(xué)習(xí)的機(jī)器人,Hassabis舉出了一些直接使用的案例:“顯然,自動(dòng)駕駛汽車是一種機(jī)器人,但目前來說還是狹義的人工智能,雖然他們使用了計(jì)算機(jī)視覺里面一些可學(xué)習(xí)的人工智能——特斯拉采用了一種基于深度學(xué)習(xí)的標(biāo)準(zhǔn)、現(xiàn)場(chǎng)的計(jì)算機(jī)視覺方案。我相信日本在老年護(hù)理機(jī)器人、家庭清潔機(jī)器人上面有很多思考,我認(rèn)為這對(duì)社會(huì)會(huì)非常有用。特別是在一個(gè)人口老齡化的社會(huì)里,我認(rèn)為是一個(gè)非常緊迫的問題?!?/span>
對(duì)人類、機(jī)器人和人工智能在未來的交互,Hassabis的期望是:“我自己對(duì)機(jī)器人沒多少思考。我自己對(duì)人工智能的使用感到興奮的領(lǐng)域是科學(xué),能夠推動(dòng)它更快的發(fā)展。我想看到人工智能未來能夠輔助科學(xué),如果有一個(gè)人工智能研究助手,它可以做很多乏味的工作,閱讀有趣的論文,從海量的數(shù)據(jù)中找到結(jié)構(gòu),并把它們呈現(xiàn)到人類專家和科學(xué)家面前,以實(shí)現(xiàn)更快的技術(shù)突破。我?guī)讉€(gè)月前在歐洲核子研究中心做演講,很顯然它們創(chuàng)造出比地球上任何地方都多的數(shù)據(jù),我們都知道在它們海量的硬盤中,可能會(huì)有某個(gè)新的粒子發(fā)現(xiàn),但沒有人能抽出時(shí)間做這件事情,因?yàn)檫@里的數(shù)據(jù)量的確太過龐大。所以我覺得,如果有一天人工智能參與尋找到一個(gè)新的粒子,那么是一件非??岬氖??!?/span>