4月17日下午,湛廬特別邀請圣塔菲研究所客座教授、《AI 3.0》一書作者梅拉妮·米歇爾,中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點實驗室主任王飛躍,馭勢科技聯(lián)合創(chuàng)始人、董事長兼CEO吳甘沙,清華大學(xué)計算機系副教授、智源青年科學(xué)家劉知遠等國內(nèi)外知名科學(xué)家和創(chuàng)業(yè)者,以及特別嘉賓達闥云端機器人小姜,一起探討AI 3.0時代的新商機和新生態(tài)。
這次全智能場景發(fā)布會第一次采用了演播室和戶外智能場景雙現(xiàn)場形式,在無人駕駛汽車和云端智能機器人的烘托下,全面展示了中國人工智能領(lǐng)域的創(chuàng)新實力和前沿進展。幾位科學(xué)家、企業(yè)家跨界深度交流,共同探討了人工智能發(fā)展現(xiàn)狀,以及透視當下AI發(fā)展的關(guān)鍵問題,并對產(chǎn)業(yè)布局和政策提出了可供參考的建議,助力未來的想象與開創(chuàng)。
以下為梅拉妮·米歇爾教授演講精華內(nèi)容
圣塔菲研究所客座教授 暢銷書《復(fù)雜》作者 梅拉妮·米歇爾(Melanie Mitchell)
廣大讀者朋友們,大家好,我是梅拉妮·米歇爾,是圣達菲研究所的教授,也是這本剛剛被翻譯成中文的《AI 3.0》一書的作者,我寫這本書的原因是為了與非專業(yè)人士探討人工智能的現(xiàn)狀。
有些讀者可能讀過我以前出版的一本書的中文版——《復(fù)雜》,并且可能會想知道兩本書之間的關(guān)系。我對此先做一個簡要的說明:
《復(fù)雜》這本書是對復(fù)雜系統(tǒng)科學(xué)的一個概述,復(fù)雜系統(tǒng)科學(xué)研究的是復(fù)雜行為如何從相對簡單的組成部分之間的相互作用中產(chǎn)生;
而《AI 3.0》則是深度聚焦于復(fù)雜系統(tǒng)科學(xué)中的一些最難的問題,比如智能的本質(zhì)是什么?研究者是如何創(chuàng)建智能機器的?我們?nèi)绾卧u判這一領(lǐng)域目前所
取得的成就?今天的機器距離真正像人一樣來理解世界還有多遠?
如今,我們都聽說了許多關(guān)于人工智能(AI)的應(yīng)用,以及人工智能(AI)將如何改變我們生活的方方面面。人工智能系統(tǒng)在我們的日常生活中隨處可見,人工智能系統(tǒng)會為我們找出最佳的行駛路線,它還可以識別人臉、轉(zhuǎn)錄語音、回答人類的問題,把文本翻譯成不同的語言,它們可以在復(fù)雜的游戲中打敗人類,甚至可以自主駕駛。
但這些系統(tǒng)到底有多智能呢?要過多久它們才能真正達到人類智能的水平,甚至超越人類?人類智能創(chuàng)造AI程序最大的挑戰(zhàn)是什么?如何解決這些挑戰(zhàn)?我們真的想要創(chuàng)造這樣的東西嗎?以上這些都是我今天想涵蓋的主題。我會以一種非專業(yè)人士可以理解的以及從事AI研究的人們同樣也感興趣的方式去講述。
首先我會簡單地談?wù)勅斯ぶ悄艿陌l(fā)展歷史,以及我們是如何到達AI 3.0(第三代人工智能)的。
AI 1.0是大約始于20世紀50年代的第一代人工智能,那是人類工程知識的時代。
也就是說人類會結(jié)合自己的知識編寫程序,例如對鳥類進行分類。如果一只鳥很大,但不會飛,那它可能是鴕鳥;如果它很大還會飛,而且又硬又禿,那它可能就是一只鷹。
這些所謂的專家系統(tǒng)有許多復(fù)雜的案例,但不幸的是這個系統(tǒng)很難整合所有的人類知識。例如,如果有一只翅膀折斷的鳥該怎么分類?這樣的例子不在整個專家?guī)炖?,因此該系統(tǒng)就會出錯。
AI 2.0是大約始于20世紀90年代的機器學(xué)習(xí)時代,在過去的10年左右被稱為深度學(xué)習(xí)革命。
在這個時代,人工智能系統(tǒng)從數(shù)據(jù)而非人類專家?guī)炀幹频某绦蛑羞M行學(xué)習(xí)。在最新一輪的深度學(xué)習(xí)革命中,這些系統(tǒng)是基于人腦如何學(xué)習(xí),以及人腦如何由多層相互反饋的神經(jīng)元構(gòu)成來進行建模的。
其中神經(jīng)元層的數(shù)量被稱為網(wǎng)絡(luò)的深度,由多層模擬神經(jīng)元組成的網(wǎng)絡(luò)是一個通過深度學(xué)習(xí)進行學(xué)習(xí)的深度網(wǎng)絡(luò),深度學(xué)習(xí)帶來了我之前提到的人工智能領(lǐng)域最近取得的所有重大成就,但它有很多局限性。
一方面,深度神經(jīng)網(wǎng)絡(luò)需要從人類標記的大規(guī)模數(shù)據(jù)集進行學(xué)習(xí)。例如,ImageNet數(shù)據(jù)集是一組從互聯(lián)網(wǎng)上爬取的超過100萬張圖片的龐大集合,人類已標記出了其中每個圖片里的目標類別,ImageNet使計算機視覺、人臉識別等其他應(yīng)用產(chǎn)生了巨大的進步,但總的來說,為了使神經(jīng)網(wǎng)絡(luò)不出任何錯誤,要標記出充分訓(xùn)練一個神經(jīng)網(wǎng)絡(luò)所需的所有圖片是不可能的。
深度神經(jīng)網(wǎng)絡(luò)的另一個問題是其復(fù)雜性,還有其決策的不可解釋性。舉個發(fā)生在我自己實驗室里的例子,一個學(xué)生正在訓(xùn)練判斷一張圖片是否包含動物的神經(jīng)網(wǎng)絡(luò),你可以看到,它對像這樣包含動物的圖片,與其他像這樣不包含動物的圖片的分類是正確的。但該網(wǎng)絡(luò)無法解釋它做決策的原因,我的學(xué)生在做了大量的工作后發(fā)現(xiàn)該網(wǎng)絡(luò)實際上利用的是這樣的線索——有動物圖像的背景是模糊的,沒有動物的圖像背景是清晰的,這是由于在這里攝影師正聚焦于前景中的這只動物,因此不需要把焦點放在前景上。該神經(jīng)網(wǎng)絡(luò)使用的線索并非我們想讓它成功完成這項任務(wù)的線索,這種情況在機器學(xué)習(xí)中隨處可見。
由于神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)中學(xué)到的是這些表面的線索,因此它們經(jīng)常會犯一些不像人類的錯誤。例如,深度神經(jīng)網(wǎng)絡(luò)以非常高的可信度正確地將這張照片分類為消防車,但如果那輛消防車通過Photoshop改為不同的形態(tài),神經(jīng)網(wǎng)絡(luò)會非常自信地認為現(xiàn)在它是一輛校車、一艘消防船或一輛雪橇。所以在某種程度上神經(jīng)網(wǎng)絡(luò)感知到的東西與我們?nèi)祟愒谶@些圖像中感知到的東西非常不同,而且我們很難理解它為什么會犯這些錯誤。
深度神經(jīng)網(wǎng)絡(luò)也很難將它們學(xué)到的知識遷移到新場景中,比如,一個神經(jīng)網(wǎng)絡(luò)學(xué)著玩電子游戲《打磚塊》(Breakout),在這個游戲中,需要移動一個球拍來擊球,擊碎這些彩色的部分(即磚塊)。這臺計算機使用深度學(xué)習(xí)的方法來學(xué)習(xí)如何比人類玩得更好,但如果當球拍向上移動了幾個像素,游戲就會發(fā)生一些微小的變化,盡管人類可以很容易地調(diào)整自己的知識來玩這個新游戲,但神經(jīng)網(wǎng)絡(luò)卻無法調(diào)整自己的知識來玩好這個新游戲。
最后,深度神經(jīng)網(wǎng)絡(luò)容易受到對抗性攻擊。例如,研究人員能夠開發(fā)出一些有趣的眼鏡,他們可以戴它來愚弄深度神經(jīng)網(wǎng)絡(luò)和人臉識別系統(tǒng),讓它們誤判自己是其他人。比如,神經(jīng)網(wǎng)絡(luò)被這款眼鏡欺騙,認為這個男人是女演員米拉·喬沃維奇(Milla Jovovitch)。這款眼鏡上精心設(shè)計的特殊圖案能夠騙過神經(jīng)網(wǎng)絡(luò),這意味著它們看到的東西或捕捉到的線索,與我們?nèi)祟愒谶@些圖像中所感知到的信息是非常不同的。
AI 3.0是人工智能的下一個時代。在這個時代里,我們期望人工智能系統(tǒng)更加魯棒,更易于解釋,適應(yīng)性更強。
我們開發(fā)類似系統(tǒng)的方式是,發(fā)現(xiàn)如何讓系統(tǒng)像人類一樣以一種主動的無監(jiān)督的方式學(xué)習(xí),類似孩子們學(xué)習(xí)或掌握常識的方式。比如,如果一個球跑到街上,它可能會被一個孩子尾隨,我們希望自動駕駛汽車理解這種情況。還存在有許許多多這樣類似的情況,但我們很難寫下所有的規(guī)則,因此我們希望計算機能發(fā)展出人類所擁有的感知能力。我們希望系統(tǒng)能夠通過類比泛化它們的知識,比如,如果系統(tǒng)在一個簡單的情況下學(xué)會了識別橋梁,它就能更普遍地識別其他類型的橋梁,而且我們也希望系統(tǒng)能解釋它們的決策。所有這些都是人工智能尚未解決的基本挑戰(zhàn),但它們構(gòu)成了該領(lǐng)域取得進展的基本問題。
我們?nèi)绾尾拍軇?chuàng)造出具有類似人類能力的機器呢?這些是目前人工智能研究中最困難和最具挑戰(zhàn)性的領(lǐng)域,如果你覺得這一切很有趣,我希望你能讀一下我的書《AI 3.0》。
AI 3.0是人工智能歷史上最激動人心、最關(guān)鍵的時刻,每個人都應(yīng)該了解人工智能的發(fā)展方向,我的書將幫助你理解這些問題和主張、存在的局限性以及危險,特別是智能機器的未來前景。