熱點資訊

熱點資訊

了解國興智能的最新動態

人工智能的漫漫長路,這些人功不可沒
2017-02-06
熱點資訊
圖片來自123rf

時至春(chun)(chun)季,人工(gong)智能的春(chun)(chun)天也來了。

從(cong)去年 AlphaGo 與李(li)世石(shi)的人機大戰之后(hou),人工智(zhi)(zhi)能(neng)瞬間成(cheng)為(wei)科技(ji)行業最為(wei)耀眼的明星。除了國內外的巨頭動作頻繁,該領域的創業公司(si)也如雨后(hou)春筍般(ban)生(sheng)長起(qi)來(lai)。而這(zhe)背后(hou),自然離不開(kai)讓機器學會思考的造物主們。本文,我們就來(lai)認(ren)識一些將人工智(zhi)(zhi)能(neng)夢想變成(cheng)現實(shi)的功臣們。

阿蘭⋅圖靈(ling)

圖片來源BBC

二戰時阿蘭⋅圖靈在(zai)布萊切利(li)公園擔任(ren)解碼(ma)專家,于(yu) 1940 年創造出可以破(po)譯德軍(jun)密報的(de)(de)機(ji)器 Bombe,為盟軍(jun)的(de)(de)勝利(li)立(li)下了(le)汗馬功勞。戰后(hou),他任(ren)職于(yu)泰丁頓(dun)國家物理研(yan)究(jiu)所,開始(shi)從事“自動計(ji)算(suan)機(ji)”的(de)(de)邏(luo)輯設(she)計(ji)和具體研(yan)制工作。1946 年,圖靈發表論文闡(chan)述存(cun)儲(chu)程序計(ji)算(suan)機(ji)的(de)(de)設(she)計(ji),因此(ci)被稱(cheng)為計(ji)算(suan)機(ji)之(zhi)父。

基于計算機,他還思考(kao)(kao)怎么(me)去創造一個思考(kao)(kao)的(de)(de)機器(qi)(Thinking Machine)。他說:“要建造一個智(zhi)能的(de)(de)機器(qi)的(de)(de)話,可(ke)能最好(hao)的(de)(de)方法就是用錢買(mai)得到(dao)的(de)(de)最好(hao)的(de)(de)感知(zhi)器(qi)來組建它(ta),并教(jiao)會它(ta)使用英(ying)文。”

圖(tu)(tu)靈(ling)(ling)并(bing)沒有建立(li)起人(ren)工(gong)智(zhi)能這個領(ling)域,但是他帶來了最初的(de)(de)一(yi)些重要(yao)(yao)的(de)(de)思想元素:我們要(yao)(yao)做一(yi)個會思考(kao)的(de)(de)機(ji)(ji)器(qi),里面就(jiu)需要(yao)(yao)包括:視覺、語言。另外(wai),圖(tu)(tu)靈(ling)(ling)還提出(chu)著名的(de)(de)“圖(tu)(tu)靈(ling)(ling)測試(shi)”,指出(chu)如果第(di)三者無法辨(bian)別人(ren)類與人(ren)工(gong)智(zhi)能機(ji)(ji)器(qi)反(fan)應的(de)(de)差別,則(ze)可以論斷(duan)該(gai)機(ji)(ji)器(qi)具備人(ren)工(gong)智(zhi)能。“圖(tu)(tu)靈(ling)(ling)的(de)(de)成(cheng)就(jiu)不得地讓(rang)我們聯(lian)想,是否等到人(ren)類滅亡之后會留下機(ji)(ji)器(qi)人(ren)來統治這個世界。”互聯(lian)網之父文特·瑟(se)夫如此評論。正是圖(tu)(tu)靈(ling)(ling)開啟了人(ren)工(gong)智(zhi)能研(yan)究的(de)(de)先河。如今,由美國計算機(ji)(ji)協會(The Association for Computing Machinery)設立(li)圖(tu)(tu)靈(ling)(ling)獎為其最高(gao)獎項,以表彰(zhang)圖(tu)(tu)靈(ling)(ling)在計算機(ji)(ji)以及人(ren)工(gong)智(zhi)能領(ling)域的(de)(de)特殊(shu)貢獻。

Terry Winograd

Terry Winograd

Terry 是人工(gong)智(zhi)能(neng)界,第(di)一(yi)代把圖靈的思想付諸實踐的人,他也(ye)是現(xian)在(zai)在(zai)世的計算(suan)機界最(zui)(zui)偉大(da)的科學家之一(yi)。Terry 不光在(zai)人工(gong)智(zhi)能(neng)領域(yu)做了最(zui)(zui)重(zhong)要的工(gong)作,而且他后來(lai)轉行去做人機交互,也(ye)把這(zhe)個領域(yu)重(zhong)新帶動(dong)了起(qi)來(lai)。

在 Terry 看來,要實現人工智能,需要有這 3 個要素:語法,語義和推理。他說一個人,或者一個機器,要去理解世界,需要去感知。感知以后,需要做的第一件事是對這個世界的結構進行理解,這叫語法的理解(Syntax Understanding)。Terry 說,機器能夠理解語法以后,接下去需要做的就是理解語義(Semantics)。語義就是指含義,語言有語言的含義,視覺有物體、有動作,有視覺的含義。最后,當我們把語法和語義解決以后,智能的機器或者是人主要解決的問題就是統計推理(Inference)這個過程。1970 年,Terry Winograd 教授在麻省理工學院人工智能實驗室創建了 SHRDLU(積木世界),其被譽為微世界程序的最高成就,它能用普通的英語句子與人交流,還能作出決策并執行操作。可以說它既是自然人展示自己如何借助計算機實現自然語言理解的一個經典示例,也是怎樣應用計算機有效進行自然語言處理的一個里程碑。
Geffory Hinton

Geoffrey Hinton

人(ren)類大(da)腦有(you)數十(shi)億個神(shen)經細(xi)胞,它們(men)之(zhi)間通(tong)過神(shen)經突(tu)觸相互(hu)影(ying)響(xiang),形成極(ji)其復(fu)雜(za)的(de)(de)相互(hu)聯系。然而科學家們(men)并不能(neng)解釋這(zhe)些(xie)具體的(de)(de)影(ying)響(xiang)和聯系。神(shen)經到底是如何進行(xing)學習以及計算的(de)(de),對于 Hinton,這(zhe)些(xie)正是他(ta)所關(guan)心的(de)(de)問題。他(ta)不知道所有(you)的(de)(de)答案,但在他(ta)的(de)(de)努(nu)力(li)之(zhi)下已經取(qu)得了進展。

Geoffrey Hinton 被尊(zun)稱為“神(shen)經(jing)(jing)網絡(luo)之(zhi)父”,將 Back Propagation(反(fan)向傳播)算法應(ying)(ying)用(yong)到神(shen)經(jing)(jing)網絡(luo)與深度學(xue)習,還提出了“Dark Knowledge”概(gai)念(nian)。他將神(shen)經(jing)(jing)網絡(luo)帶入到研究(jiu)與應(ying)(ying)用(yong)的(de)(de)(de)熱潮,這些人工神(shen)經(jing)(jing)網絡(luo)可(ke)以(yi)(yi)收集信息,也可(ke)以(yi)(yi)對其做出反(fan)應(ying)(ying)。它(ta)(ta)們(men)能對事物的(de)(de)(de)外形(xing)和聲(sheng)音做出解(jie)釋。它(ta)(ta)們(men)對語言的(de)(de)(de)理解(jie)也在進步。它(ta)(ta)們(men)可(ke)以(yi)(yi)自行學(xue)習與工作,而(er)不需要人為提示(shi)或者(zhe)參與控制。這些正是它(ta)(ta)們(men)與傳統的(de)(de)(de)學(xue)習機器(qi)的(de)(de)(de)區別。隨著(zhu)時(shi)間(jian)的(de)(de)(de)推(tui)移,計(ji)算機能力的(de)(de)(de)發展,神(shen)經(jing)(jing)網絡(luo)也更加(jia)快速,靈(ling)活(huo),高效,得(de)到了很(hen)好(hao)的(de)(de)(de)擴(kuo)展。

據了解,早在 80 年代初期,當(dang) Hinton 和他(ta)的(de)(de)(de)(de)同事(shi)(shi)(shi)們(men)剛開始這(zhe)項(xiang)研究時(shi),那時(shi)的(de)(de)(de)(de)電(dian)腦(nao)還不(bu)夠(gou)快(kuai),不(bu)足以(yi)處理有關神經網絡的(de)(de)(de)(de)這(zhe)些龐大的(de)(de)(de)(de)數據,他(ta)們(men)取得的(de)(de)(de)(de)成就是有限的(de)(de)(de)(de)。而當(dang)時(shi) AI 普遍的(de)(de)(de)(de)研究方(fang)向也與他(ta)們(men)相反,都在試(shi)圖尋找(zhao)捷徑,直接模擬出行為,而不(bu)是試(shi)圖通過模仿大腦(nao)的(de)(de)(de)(de)運作來實現(xian)。在這(zhe)樣艱(jian)難的(de)(de)(de)(de)環境下,只有 Hinton 和他(ta)的(de)(de)(de)(de)同事(shi)(shi)(shi)堅持了下來,而事(shi)(shi)(shi)實則(ze)證(zheng)明(ming)他(ta)們(men)是對的(de)(de)(de)(de)。

Geoffrey Hinton 于 2006 年在《Science》上發表(biao)的(de)(de)(de)(de)論文首次(ci)提出(chu)深度(du)學(xue)(xue)習(xi)的(de)(de)(de)(de)主要觀點。從(cong) 2012 年取(qu)得 ImageNet 競賽(sai)的(de)(de)(de)(de)標(biao)志(zhi)性(xing)事(shi)件之后,深度(du)學(xue)(xue)習(xi)不(bu)斷取(qu)得一系列(lie)的(de)(de)(de)(de)重大進(jin)展,解決了(le)人工智(zhi)能界的(de)(de)(de)(de)盡最(zui)大努力很多年仍沒有進(jin)展的(de)(de)(de)(de)問(wen)題,除了(le)在圖(tu)像識別、語(yu)音識別等領域打破了(le)紀(ji)錄,還(huan)在其他的(de)(de)(de)(de)領域擊敗了(le)其他機器學(xue)(xue)習(xi)技術,包括預(yu)測(ce)潛在的(de)(de)(de)(de)藥物分子(zi)的(de)(de)(de)(de)活性(xing)、分析粒子(zi)加速器數據、重建(jian)大腦(nao)回路、預(yu)測(ce)非編碼 DNA 突變對基因表(biao)達(da)和疾病的(de)(de)(de)(de)影(ying)響。更(geng)令人驚訝的(de)(de)(de)(de)是(shi),深度(du)學(xue)(xue)習(xi)在自(zi)然(ran)語(yu)言(yan)理解的(de)(de)(de)(de)各(ge)項任務(wu)中也(ye)有非常可喜的(de)(de)(de)(de)成果,特別是(shi)主題分類、情感分析、自(zi)動(dong)問(wen)答和語(yu)言(yan)翻譯(yi)。

可以說,正(zheng)是 Geoffrey Hinton 將“深(shen)度學習(xi)”從邊緣(yuan)課題變成了谷(gu)歌等(deng)互聯網巨頭仰賴的核心技術。

Yann LeCun

yann-lecun-660x440

Yann LeCun,Geoffrey Hinton 的(de)(de)博士后(hou)學(xue)生,也(ye)是將 CNNs 應用(yong)最成功的(de)(de)人(CNNs,是一種(zhong)深(shen)度的(de)(de)監督學(xue)習下的(de)(de)機(ji)(ji)器(qi)學(xue)習模(mo)型)。目前(qian)感(gan)興趣的(de)(de)研究領域包括人工智(zhi)能、機(ji)(ji)器(qi)學(xue)習、計(ji)算機(ji)(ji)感(gan)知、機(ji)(ji)器(qi)人和(he)計(ji)算神(shen)(shen)經科學(xue)。他最出(chu)名的(de)(de)是對深(shen)度學(xue)習和(he)神(shen)(shen)經網絡(luo)的(de)(de)貢(gong)獻,特別是廣泛用(yong)于計(ji)算機(ji)(ji)視(shi)覺和(he)語(yu)音識(shi)別應用(yong)的(de)(de) CNN(卷(juan)積神(shen)(shen)經網絡(luo)),他第一個(ge)把 BP 算法用(yong)在(zai)(zai)(zai) CNN 上(shang)并(bing)且完(wan)善 CNN 使得(de)它可以(yi)(yi)在(zai)(zai)(zai)真(zhen)實場(chang)景(jing)中得(de)以(yi)(yi)應用(yong),并(bing)在(zai)(zai)(zai)這些主題以(yi)(yi)及手寫(xie)字體識(shi)別、圖像壓縮和(he)人工智(zhi)能硬件(jian)等主題上(shang)發表過 190 多份論文(wen)。

LeCun 使 CNN 成為目前人工智能領域最有用(yong)的(de)模型(xing)。在(zai)谷歌,卷積神經網(wang)絡幫助他們在(zai)安卓手機上開(kai)發(fa)語音識別(bie)系統;而百度則(ze)可以利用(yong)它開(kai)發(fa)全新的(de)視覺(jue)搜索引擎。

Yann LeCun 是(shi)紐(niu)約(yue)大學(xue)(xue)終身(shen)教授(shou),現任 Facebook 人(ren)工(gong)智能實驗室負責人(ren)。LeCun 位(wei)(wei)列新澤西州(zhou)的(de)發明家名(ming)人(ren)堂,并獲得 2014 年(nian)(nian) IEEE 神經(jing)網絡先鋒獎、2015 年(nian)(nian) IEEE PAMI 杰出研究獎、2016 年(nian)(nian) Lovie 終身(shen)成就獎和來自(zi)墨西哥 IPN 的(de)名(ming)譽博(bo)士(shi)學(xue)(xue)位(wei)(wei)。

Yoshua Bengio

Yoshua Bengio

Yoshua Bengio 教授是(shi)機器(qi)學(xue)(xue)習大(da)神之一,尤其(qi)是(shi)在深(shen)度學(xue)(xue)習這個(ge)領(ling)域(yu)。他連同 Geoff Hinton 以及 Yann LeCun 教授,締造了 2006 年開始的深(shen)度學(xue)(xue)習復興。

其(qi)他方面,Bengio 的(de)(de)《a neural probabilistic language model》這篇(pian)論文開(kai)創了神(shen)經網絡做 language model 的(de)(de)先(xian)河,里面的(de)(de)思路影響、啟(qi)發了之后的(de)(de)很(hen)多(duo)基于神(shen)經網絡做 nlp(自然語音處理) 的(de)(de)文章。

Bengio 博(bo)士后的(de)導師(shi) Jordan 曾提到(dao):“到(dao)目(mu)前(qian)為止,在更(geng)高級的(de)自然(ran)語(yu)(yu)言處(chu)理(li)任務(wu)中,深度學習并未像在語(yu)(yu)音(yin)識別、物體(ti)識別等任務(wu)上(shang)做到(dao)的(de)那樣,顯著降低錯(cuo)誤率(lv)。”所以在 Hinton 提出深度學習概(gai)念激活了(le)(le)整個(ge)領域(yu)、lecun 發表了(le)(le)卷(juan)積神經網絡(luo) (CNN) 這樣的(de)階段性突破(po)成果的(de)前(qian)提下,Bengio 對(dui)自然(ran)語(yu)(yu)音(yin)處(chu)理(li)難題的(de)貢獻是非(fei)常有意(yi)義的(de)。

Jürgen Schmidhuber

Jürgen Schmidhuber

1997 年,Schmidhuber 博士(shi)和他的(de)(de)同事發表了一(yi)篇(pian)技術論文,后來證明這篇(pian)論文對最近的(de)(de)視覺和語音(yin)上的(de)(de)快速進(jin)展起到了關鍵作(zuo)用。這個(ge)方法(fa)被稱長(chang)短(duan)期記(ji)憶,簡稱為 LSTM。這個(ge)方法(fa)在剛引進(jin)時沒有得到廣泛的(de)(de)理解。它主要提(ti)供了一(yi)種記(ji)憶形式,或者說是一(yi)種神經網絡的(de)(de)環(huan)境。

就像人類不會每次都從(cong)頭學起一樣,神經網絡(luo)的機(ji)(ji)制中存在(zai)循環和(he)記憶(yi)的機(ji)(ji)制,每個輸入的單詞(ci)和(he)觀察到(dao)的像素都會被其理解(jie)。長短時(shi)記憶(yi)(LSTM)的出現讓這種系統的表現得到(dao)了很大(da)的提(ti)升(sheng),輸出結(jie)果瞬間變得準確(que)。

去年,谷歌的(de)(de)研究(jiu)(jiu)人員在這一(yi)方面(mian)的(de)(de)研究(jiu)(jiu)得到發表(biao),他們使用 LSTM 減(jian)少了 49% 的(de)(de)語音識(shi)別錯誤,這是一(yi)個飛躍性(xing)進步(bu)。

 

相關標簽