南京大學(xué)黨委書記、中國科學(xué)院院士譚鐵牛在2025中國具身智能大會(CEAI 2025)作題為“具身智能:學(xué)科交叉的新前站”的主題演講。他表示,具身智能是發(fā)展人工智能的重要路徑,是學(xué)科交叉和新一輪科技革命的新前沿,是發(fā)展新質(zhì)生產(chǎn)力的重要引擎,產(chǎn)業(yè)界要多措并舉,理性務(wù)實推動具身智能創(chuàng)新發(fā)展。
具身智能(Embodied Intelligence)最早由艾倫·圖靈于1950年提出,其核心定義為:?物理實體通過與外部環(huán)境持續(xù)交互而不斷增長的智能?。人類智能的形成即源于此過程,如貓的智能水平差異實驗表明,與外界交互的程度直接影響智能發(fā)展。
漢字“智”隱含著具身思想
譚鐵牛認為,祖先創(chuàng)造漢字“智”字時,其造字邏輯(“知”與“日”的結(jié)合)隱含著“知識需通過實踐積累升華”的具身思想。《荀子·正名》里有一句話,“所以知之在人者謂之知”,也就是通過學(xué)習(xí)獲得對外部世界的認識和了解叫知識的知。“只有把這些知識通過相應(yīng)的思考和跟外部的驗證,才能上升為對外部世界規(guī)律性的認識,‘智’字是上下結(jié)構(gòu),知就是知識,日就是表示知道,意味著時間、經(jīng)驗和經(jīng)歷,也就是說‘智’是由知識和時間經(jīng)歷的積累構(gòu)成的,這里面就包含了具身的概念。具身智能是生物智能形成的基本,通過研究具身智能,對研究認知科學(xué)有促進作用。”
譚鐵牛指出,具身智能發(fā)展分為三個階段,一是萌芽起步期(1940—2000):具身智能研究停留在認知學(xué)討論和早期實驗性嘗試,模式識別、控制、機械各自發(fā)展,未能形成具身智能系統(tǒng)級合力。二是技術(shù)積累期(2000—2022):深度學(xué)習(xí)技術(shù)取得突破,人工智能各分支得到長足發(fā)展,“深度學(xué)習(xí)+機器人智能化”水平不斷提升的同時,各學(xué)科逐漸圍繞“具身化”融合展開研究,但更多集中在單一任務(wù)泛化性,缺乏一體化具身智能研究。三是快速發(fā)展期(2022—至今):大模型的創(chuàng)新突破使具身智能研究步入快車道,人工智能、機器人、虛擬仿真、認知學(xué)等學(xué)科領(lǐng)域開始圍繞具身智能呈現(xiàn)深度融合趨勢。
為什么要研究具身智能?第一,可以?突破傳統(tǒng)AI局限,重塑人工智能發(fā)展路徑,為探索人類智能形成機制提供新視角。??傳統(tǒng)人工智能依賴“算力+數(shù)據(jù)”的堆砌模式,存在性能提升瓶頸和場景適應(yīng)性不足問題,可以轉(zhuǎn)向生物啟發(fā)式創(chuàng)新。具身智能通過物理實體與環(huán)境的動態(tài)交互,實現(xiàn)“感知—決策—行動”閉環(huán),更接近生物智能的進化邏輯。例如嬰兒通過觸摸、摔倒等交互行為學(xué)習(xí)行走,而非預(yù)先編程。“人工智能下一步怎么發(fā)展?還是要多借鑒生物智能,所以要研究具身智能。具身智能也是發(fā)展人工智能的重要途徑。”譚鐵牛說。第二,具身智能是新質(zhì)生產(chǎn)力的重要引擎。通過物理載體與實體經(jīng)濟深度融合,可以推動科技成果轉(zhuǎn)化。“當下人工智能發(fā)展方向主要是多用智能,主要代表就是多模態(tài)大模型。下一步一定是實體多通用智能,它的關(guān)鍵技術(shù)就是具身智能。”譚鐵牛表示。
具身智能發(fā)展五大趨勢
譚鐵牛認為,具身智能發(fā)展將呈現(xiàn)五大趨勢。第一,?多學(xué)科深度交叉融合。?具身智能作為學(xué)科交叉的天然載體,其發(fā)展依賴于傳感器技術(shù)、仿生材料、控制工程與人工智能的協(xié)同創(chuàng)新。例如觸覺傳感器的靈敏度提升需納米材料與微電子技術(shù)突破,運動控制的精準性需神經(jīng)動力學(xué)與強化學(xué)習(xí)算法融合。這一過程不僅加速技術(shù)突破,更將催生智能仿生學(xué)、認知機器人學(xué)等新興交叉學(xué)科。
第二,?任務(wù)模型向廣域基座演進。?當前基于特定場景的小模型將向跨領(lǐng)域通用化基座模型升級,其關(guān)鍵在于構(gòu)建?大規(guī)模具身數(shù)據(jù)平臺?。具身智能需建立涵蓋多模態(tài)感知、物理交互的開放數(shù)據(jù)集,通過海量實體交互數(shù)據(jù)訓(xùn)練出適應(yīng)復(fù)雜場景的通用模型基座。
第三,?虛實空間深度融合共生。?虛擬仿真與物理驗證的閉環(huán)將成為技術(shù)迭代核心路徑:虛擬空間通過數(shù)字孿生技術(shù)實現(xiàn)智能體快速訓(xùn)練(如特斯拉人形機器人仿真訓(xùn)練效率提升10倍),物理空間則提供真實反饋優(yōu)化算法模型。二者融合將突破“莫拉維克悖論”,使機器人在非結(jié)構(gòu)化環(huán)境中獲得類人的環(huán)境適應(yīng)能力。
第四,?應(yīng)用邊界指數(shù)級拓展。?隨著靈巧操作(<0.1mm精度)、多模態(tài)感知(觸覺分辨率達0.5N)、集群協(xié)作(百臺級機器人協(xié)同誤差<1cm)等關(guān)鍵技術(shù)突破,應(yīng)用場景將從工業(yè)制造向深海勘探、太空作業(yè)、微觀手術(shù)等極端環(huán)境延伸,2030年全球具身智能產(chǎn)業(yè)規(guī)模有望突破萬億美元。
第五,?創(chuàng)新資源集聚式發(fā)展。?人才、資本、政策將形成“三螺旋”驅(qū)動機制。高校重構(gòu)“智能+機器人”跨學(xué)科培養(yǎng)體系,產(chǎn)業(yè)資本通過專項基金加速技術(shù)商業(yè)化,政府則通過創(chuàng)新園區(qū)構(gòu)建“研發(fā)—中試—量產(chǎn)”生態(tài)閉環(huán)。
這五大趨勢共同指向具身智能發(fā)展的核心規(guī)律:?以物理實體為錨點,通過“數(shù)據(jù)—算法—載體”的閉環(huán)迭代,驅(qū)動人工智能從虛擬認知向?qū)嶓w智能的范式躍遷?。其演進過程既需攻克觸覺傳感、精密傳動等“硬科技”壁壘,更需建立跨學(xué)科、跨產(chǎn)業(yè)、跨虛實的新型創(chuàng)新生態(tài)。
五方面推動具身智能發(fā)展
如何推動具身智能產(chǎn)業(yè)的發(fā)展?譚鐵牛提出五點建議。第一,完善戰(zhàn)略規(guī)劃與頂層設(shè)計。從理論基礎(chǔ)到軟硬件支撐,從材料、系統(tǒng)到安全評測,再到應(yīng)用賦能場景設(shè)計,行業(yè)要持續(xù)完善戰(zhàn)略規(guī)劃和頂層設(shè)計。第二,推動學(xué)科融合與前沿布局。鼓勵多學(xué)科交叉研究,推動數(shù)據(jù)平臺、算力平臺等基礎(chǔ)設(shè)施建設(shè),為具身智能發(fā)展創(chuàng)造條件。第三,加強國際與區(qū)域協(xié)同合作。鼓勵國內(nèi)外科研團隊聯(lián)合攻關(guān),共同推動理論和應(yīng)用創(chuàng)新研究,構(gòu)建全球合作網(wǎng)絡(luò)。搭建區(qū)域性具身智能創(chuàng)新平臺,推動區(qū)域協(xié)同發(fā)展。第四,深化科技與產(chǎn)業(yè)融合創(chuàng)新。“產(chǎn)學(xué)研”協(xié)同創(chuàng)新,探索從實驗室研究到原型機、整機系統(tǒng)開發(fā)的完整產(chǎn)業(yè)鏈,盡快實現(xiàn)技術(shù)向產(chǎn)業(yè)化轉(zhuǎn)化。圍繞智能制造、低空經(jīng)濟等重點行業(yè)建設(shè)示范工程,驗證技術(shù)落地應(yīng)用效果,同時建立行業(yè)標準和技術(shù)規(guī)范,推動具身智能在產(chǎn)業(yè)領(lǐng)域的標準化和規(guī)模化應(yīng)用。五是構(gòu)建多層次人才培養(yǎng)體系。培養(yǎng)既懂硬件又懂軟件,契合具身智能發(fā)展的人才,并促進“產(chǎn)學(xué)研”協(xié)同。同時,強化人才“引、育、用、留”,建設(shè)高質(zhì)量人才隊伍。
最后,譚鐵牛總結(jié)了具身智能產(chǎn)業(yè)的重要性。第一,具身智能既是人工智能的一種形態(tài),更是人工智能可持續(xù)發(fā)展的必由之路。“目前大家更多的時候把具身智能看成人工智能的另外一種形式,這也沒錯。但在我看來,具身智能是推動人工智能發(fā)展應(yīng)該走的道路,因為人類智能就是這樣形成的,通過自己的感官跟外部交互,在摸爬滾打中形成的。”第二,具身智能既是學(xué)科交叉的新前沿,也是推動人工智能賦能千行百業(yè)的“新靶點”。畢竟,真正助力新質(zhì)生產(chǎn)力發(fā)展一定要依靠物理世界。第三,機器人當下備受關(guān)注,前景十分廣闊,應(yīng)當理性務(wù)實推動其創(chuàng)新發(fā)展。“不要設(shè)定不切實際的發(fā)展目標,不要一哄而上大家都搞具身智能。”
來源:醫(yī)藥魔方