公司新聞

公司新聞

了解國興智能的最新動態

人工智能的漫漫長路,這些人功不可沒
2017-02-06
熱點資訊
圖片來自123rf

時至(zhi)春季,人工智能的(de)春天(tian)也來了。

從去年 AlphaGo 與李(li)世石(shi)的人機(ji)(ji)大戰之(zhi)后(hou)(hou),人工(gong)智能瞬間成(cheng)(cheng)為科技(ji)行業(ye)最為耀眼(yan)的明星。除了國內外的巨頭動作頻繁,該領(ling)域的創業(ye)公司也如雨后(hou)(hou)春(chun)筍般生(sheng)長起來。而這背(bei)后(hou)(hou),自然離(li)不(bu)開(kai)讓機(ji)(ji)器(qi)學(xue)會思(si)考的造物主們。本文,我們就來認識(shi)一些將人工(gong)智能夢(meng)想(xiang)變(bian)成(cheng)(cheng)現實的功臣(chen)們。

阿蘭⋅圖靈(ling)

圖片來源BBC

二戰時阿蘭(lan)⋅圖靈(ling)在布(bu)萊切(qie)利(li)公(gong)園(yuan)擔任解碼專(zhuan)家,于 1940 年創造出可以破譯德軍(jun)密報的機器 Bombe,為盟軍(jun)的勝利(li)立(li)下了(le)汗馬功勞(lao)。戰后(hou),他任職(zhi)于泰丁頓國家物理研究所,開始從事“自動計算機”的邏輯設計和具體研制工作。1946 年,圖靈(ling)發表論文闡述存儲(chu)程序(xu)計算機的設計,因此(ci)被稱為計算機之父。

基于計(ji)算(suan)機(ji)(ji),他(ta)(ta)還思(si)考怎么去(qu)創造一個思(si)考的(de)機(ji)(ji)器(Thinking Machine)。他(ta)(ta)說:“要(yao)建造一個智能(neng)的(de)機(ji)(ji)器的(de)話(hua),可能(neng)最好(hao)的(de)方法(fa)就是用錢買得到的(de)最好(hao)的(de)感(gan)知器來(lai)組建它,并教(jiao)會它使用英文。”

圖(tu)靈并沒有建立起人(ren)工(gong)智(zhi)(zhi)能(neng)這個(ge)領域(yu),但是(shi)他帶來(lai)了最初的(de)(de)一(yi)些重要的(de)(de)思想元素:我(wo)(wo)們要做一(yi)個(ge)會(hui)思考的(de)(de)機(ji)(ji)器,里面(mian)就需要包括:視覺、語言。另外,圖(tu)靈還提出(chu)著名的(de)(de)“圖(tu)靈測試”,指出(chu)如(ru)果第三者(zhe)無法辨別人(ren)類與(yu)人(ren)工(gong)智(zhi)(zhi)能(neng)機(ji)(ji)器反應的(de)(de)差別,則(ze)可(ke)以(yi)論斷該機(ji)(ji)器具備(bei)人(ren)工(gong)智(zhi)(zhi)能(neng)。“圖(tu)靈的(de)(de)成就不(bu)得地讓(rang)我(wo)(wo)們聯想,是(shi)否等(deng)到人(ren)類滅(mie)亡之后會(hui)留下機(ji)(ji)器人(ren)來(lai)統治這個(ge)世(shi)界。”互聯網之父文特·瑟夫如(ru)此(ci)評論。正是(shi)圖(tu)靈開啟了人(ren)工(gong)智(zhi)(zhi)能(neng)研究(jiu)的(de)(de)先河。如(ru)今,由美國(guo)計算機(ji)(ji)協會(hui)(The Association for Computing Machinery)設立圖(tu)靈獎(jiang)為(wei)其(qi)最高獎(jiang)項(xiang),以(yi)表彰圖(tu)靈在計算機(ji)(ji)以(yi)及人(ren)工(gong)智(zhi)(zhi)能(neng)領域(yu)的(de)(de)特殊貢獻。

Terry Winograd

Terry Winograd

Terry 是人工(gong)(gong)智(zhi)能界(jie),第一代把圖(tu)靈的(de)(de)思(si)想付諸實踐(jian)的(de)(de)人,他也是現在在世的(de)(de)計算機界(jie)最偉大的(de)(de)科學家之一。Terry 不光(guang)在人工(gong)(gong)智(zhi)能領域做(zuo)了最重(zhong)要的(de)(de)工(gong)(gong)作,而且(qie)他后來(lai)轉行(xing)去做(zuo)人機交互,也把這個領域重(zhong)新帶動了起來(lai)。

在 Terry 看來,要實現人工智能,需要有這 3 個要素:語法,語義和推理。他說一個人,或者一個機器,要去理解世界,需要去感知。感知以后,需要做的第一件事是對這個世界的結構進行理解,這叫語法的理解(Syntax Understanding)。Terry 說,機器能夠理解語法以后,接下去需要做的就是理解語義(Semantics)。語義就是指含義,語言有語言的含義,視覺有物體、有動作,有視覺的含義。最后,當我們把語法和語義解決以后,智能的機器或者是人主要解決的問題就是統計推理(Inference)這個過程。1970 年,Terry Winograd 教授在麻省理工學院人工智能實驗室創建了 SHRDLU(積木世界),其被譽為微世界程序的最高成就,它能用普通的英語句子與人交流,還能作出決策并執行操作。可以說它既是自然人展示自己如何借助計算機實現自然語言理解的一個經典示例,也是怎樣應用計算機有效進行自然語言處理的一個里程碑。
Geffory Hinton

Geoffrey Hinton

人類(lei)大腦有數(shu)十億個神經(jing)細(xi)胞,它們之間通過神經(jing)突觸(chu)相互影響,形成極(ji)其(qi)復雜的(de)相互聯(lian)系(xi)。然(ran)而(er)科學家(jia)們并(bing)不能(neng)解釋(shi)這(zhe)些具體的(de)影響和聯(lian)系(xi)。神經(jing)到底是如(ru)何進行學習以(yi)及(ji)計算的(de),對于 Hinton,這(zhe)些正(zheng)是他(ta)所(suo)關心的(de)問題。他(ta)不知道所(suo)有的(de)答案,但在他(ta)的(de)努力(li)之下已經(jing)取得了(le)進展(zhan)。

Geoffrey Hinton 被尊稱為“神(shen)經(jing)網絡(luo)之父”,將 Back Propagation(反(fan)(fan)向傳(chuan)播)算法應用(yong)到(dao)神(shen)經(jing)網絡(luo)與(yu)深度(du)學習(xi),還提(ti)出(chu)(chu)了“Dark Knowledge”概念。他將神(shen)經(jing)網絡(luo)帶入到(dao)研(yan)究與(yu)應用(yong)的(de)熱潮,這(zhe)些(xie)人工神(shen)經(jing)網絡(luo)可以收集信息,也(ye)(ye)可以對其(qi)做出(chu)(chu)反(fan)(fan)應。它們(men)(men)能對事物的(de)外形和聲音做出(chu)(chu)解釋(shi)。它們(men)(men)對語言的(de)理(li)解也(ye)(ye)在(zai)進步。它們(men)(men)可以自行學習(xi)與(yu)工作,而不需要(yao)人為提(ti)示(shi)或者參與(yu)控制。這(zhe)些(xie)正是它們(men)(men)與(yu)傳(chuan)統的(de)學習(xi)機器的(de)區別(bie)。隨著(zhu)時(shi)間的(de)推移,計算機能力的(de)發展,神(shen)經(jing)網絡(luo)也(ye)(ye)更加快速,靈活,高效,得到(dao)了很好的(de)擴展。

據了(le)解,早在(zai)(zai) 80 年(nian)代初(chu)期,當 Hinton 和(he)他(ta)的(de)(de)(de)(de)(de)同事(shi)們(men)剛開始這(zhe)項研(yan)究時(shi),那時(shi)的(de)(de)(de)(de)(de)電腦還不夠快,不足以處理有關神經網絡的(de)(de)(de)(de)(de)這(zhe)些龐大(da)的(de)(de)(de)(de)(de)數據,他(ta)們(men)取得的(de)(de)(de)(de)(de)成就是有限的(de)(de)(de)(de)(de)。而(er)當時(shi) AI 普(pu)遍的(de)(de)(de)(de)(de)研(yan)究方(fang)向(xiang)也與他(ta)們(men)相反,都在(zai)(zai)試圖尋(xun)找捷徑,直接模擬出行為(wei),而(er)不是試圖通過模仿(fang)大(da)腦的(de)(de)(de)(de)(de)運作來實現。在(zai)(zai)這(zhe)樣(yang)艱難的(de)(de)(de)(de)(de)環境下(xia),只(zhi)有 Hinton 和(he)他(ta)的(de)(de)(de)(de)(de)同事(shi)堅持了(le)下(xia)來,而(er)事(shi)實則證明他(ta)們(men)是對的(de)(de)(de)(de)(de)。

Geoffrey Hinton 于(yu) 2006 年(nian)在(zai)《Science》上發表的(de)(de)論文首次(ci)提出(chu)深(shen)度(du)(du)學(xue)習(xi)(xi)(xi)的(de)(de)主要觀點。從 2012 年(nian)取得 ImageNet 競賽的(de)(de)標志性事件之后(hou),深(shen)度(du)(du)學(xue)習(xi)(xi)(xi)不斷取得一系列的(de)(de)重(zhong)大(da)進展,解(jie)決了(le)(le)人(ren)工智能(neng)界的(de)(de)盡最大(da)努力很多年(nian)仍沒(mei)有進展的(de)(de)問(wen)題(ti),除了(le)(le)在(zai)圖(tu)像識(shi)別(bie)、語音識(shi)別(bie)等領域打(da)破了(le)(le)紀錄(lu),還(huan)在(zai)其他的(de)(de)領域擊敗了(le)(le)其他機器學(xue)習(xi)(xi)(xi)技術,包括預測潛在(zai)的(de)(de)藥物分子的(de)(de)活性、分析(xi)粒子加速(su)器數據、重(zhong)建大(da)腦回路、預測非(fei)編碼(ma) DNA 突變對基因(yin)表達和(he)疾病的(de)(de)影(ying)響。更令人(ren)驚訝(ya)的(de)(de)是,深(shen)度(du)(du)學(xue)習(xi)(xi)(xi)在(zai)自(zi)然語言(yan)理解(jie)的(de)(de)各項任務中也有非(fei)常(chang)可(ke)喜的(de)(de)成果,特別(bie)是主題(ti)分類、情感分析(xi)、自(zi)動(dong)問(wen)答和(he)語言(yan)翻譯。

可(ke)以說,正是 Geoffrey Hinton 將“深(shen)度學(xue)習”從(cong)邊緣課題變(bian)成(cheng)了(le)谷歌(ge)等互聯網巨頭仰賴的核(he)心技(ji)術。

Yann LeCun

yann-lecun-660x440

Yann LeCun,Geoffrey Hinton 的(de)(de)博士后學生,也是將 CNNs 應(ying)用(yong)最成功的(de)(de)人(ren)(CNNs,是一種深(shen)度的(de)(de)監督(du)學習下的(de)(de)機(ji)(ji)(ji)器學習模型(xing))。目前感(gan)興趣(qu)的(de)(de)研究(jiu)領域包括人(ren)工智(zhi)能、機(ji)(ji)(ji)器學習、計(ji)算機(ji)(ji)(ji)感(gan)知、機(ji)(ji)(ji)器人(ren)和計(ji)算神經(jing)科學。他最出名的(de)(de)是對深(shen)度學習和神經(jing)網絡的(de)(de)貢獻(xian),特別是廣泛用(yong)于計(ji)算機(ji)(ji)(ji)視覺和語音(yin)識別應(ying)用(yong)的(de)(de) CNN(卷積神經(jing)網絡),他第一個把 BP 算法用(yong)在 CNN 上(shang)并(bing)(bing)且完善 CNN 使得它可以在真實場景(jing)中得以應(ying)用(yong),并(bing)(bing)在這些主題以及手寫字體(ti)識別、圖像壓(ya)縮和人(ren)工智(zhi)能硬件等主題上(shang)發表過 190 多份論(lun)文。

LeCun 使 CNN 成為(wei)目前人(ren)工智能領域最有用的模(mo)型。在(zai)谷歌,卷積神經網絡幫助他們(men)在(zai)安(an)卓手機上開(kai)發語音識別系統;而百(bai)度則(ze)可以利(li)用它開(kai)發全新(xin)的視覺搜索引擎。

Yann LeCun 是紐約大學終身教授,現(xian)任 Facebook 人工智能實驗室負責人。LeCun 位(wei)列新澤西州的(de)發明家名人堂,并獲(huo)得(de) 2014 年(nian) IEEE 神經網絡先(xian)鋒獎(jiang)(jiang)、2015 年(nian) IEEE PAMI 杰出研究獎(jiang)(jiang)、2016 年(nian) Lovie 終身成就獎(jiang)(jiang)和來自(zi)墨西哥 IPN 的(de)名譽博士學位(wei)。

Yoshua Bengio

Yoshua Bengio

Yoshua Bengio 教(jiao)授是機器學習大神之一(yi),尤其是在(zai)深度(du)(du)學習這個領域。他(ta)連(lian)同 Geoff Hinton 以及(ji) Yann LeCun 教(jiao)授,締造了 2006 年開始的深度(du)(du)學習復興。

其他(ta)方面,Bengio 的(de)《a neural probabilistic language model》這篇(pian)論文開創了(le)神經網(wang)絡做(zuo)(zuo) language model 的(de)先河,里(li)面的(de)思(si)路影響、啟發了(le)之后的(de)很多(duo)基于神經網(wang)絡做(zuo)(zuo) nlp(自然語音處理) 的(de)文章。

Bengio 博士后的(de)(de)導師 Jordan 曾提到(dao):“到(dao)目(mu)前為止,在更(geng)高級的(de)(de)自然語言(yan)處(chu)理任(ren)務中(zhong),深度(du)學習(xi)并未像在語音識別、物體識別等任(ren)務上做到(dao)的(de)(de)那樣,顯著降(jiang)低錯(cuo)誤率。”所以(yi)在 Hinton 提出深度(du)學習(xi)概念(nian)激活了整個(ge)領域(yu)、lecun 發(fa)表了卷積神經網絡 (CNN) 這樣的(de)(de)階段(duan)性突破(po)成果的(de)(de)前提下,Bengio 對(dui)自然語音處(chu)理難題的(de)(de)貢獻是(shi)非常有意義的(de)(de)。

Jürgen Schmidhuber

Jürgen Schmidhuber

1997 年,Schmidhuber 博士和(he)他的同事發表了(le)(le)一篇技術論(lun)(lun)文(wen),后來(lai)證明這篇論(lun)(lun)文(wen)對(dui)最近的視覺和(he)語(yu)音上的快速進(jin)展(zhan)起到了(le)(le)關(guan)鍵作(zuo)用。這個方(fang)法被(bei)稱(cheng)長短(duan)期記(ji)(ji)憶,簡(jian)稱(cheng)為 LSTM。這個方(fang)法在剛引進(jin)時沒有得到廣(guang)泛的理解。它主(zhu)要提供了(le)(le)一種(zhong)記(ji)(ji)憶形(xing)式,或者說是一種(zhong)神經網絡的環境。

就像(xiang)人類不會(hui)每次(ci)都從(cong)頭學起一樣,神經網(wang)絡的(de)(de)(de)機制中存在(zai)循環和記(ji)(ji)憶(yi)(yi)的(de)(de)(de)機制,每個輸入的(de)(de)(de)單詞(ci)和觀察到的(de)(de)(de)像(xiang)素都會(hui)被其理(li)解。長(chang)短時記(ji)(ji)憶(yi)(yi)(LSTM)的(de)(de)(de)出現讓這種系統的(de)(de)(de)表現得(de)到了很大的(de)(de)(de)提(ti)升(sheng),輸出結果瞬(shun)間變得(de)準確。

去(qu)年(nian),谷(gu)歌的研(yan)究人員(yuan)在(zai)這(zhe)一(yi)方(fang)面(mian)的研(yan)究得到發(fa)表(biao),他們使用 LSTM 減少(shao)了 49% 的語音識別錯誤(wu),這(zhe)是一(yi)個飛(fei)躍(yue)性進(jin)步。

 

相關標簽