• 
    <ul id="auswy"><sup id="auswy"></sup></ul>
  • <ul id="auswy"></ul>
    ABB
    關注中國自動化產業發展的先行者!
    CAIAC 2025
    2025工業安全大會
    OICT公益講堂
    當前位置:首頁 >> 資訊 >> 行業資訊

    資訊頻道

    研究揭示多模態大模型涌現類人物體概念表征
    • 點擊數:291     發布時間:2025-06-10 19:31:16
    • 分享到:
    人類能夠對自然界中的物體進行概念化,這一認知能力長期以來被視為人類智能的核心。當我們看到“狗”“汽車”或“蘋果”時,不僅能識別它們的物理特征(尺寸、顏色、形狀等),還能理解其功能、情感價值和文化意義——這種多維度的概念表征構成了人類認知的基石。隨著ChatGPT等大語言模型(LLMs)的爆發式發展,一個根本性問題浮出水面:這些大模型能否從語言和多模態數據中發展出類似人類的物體概念表征?
    關鍵詞:

    人類能夠對自然界中的物體進行概念化,這一認知能力長期以來被視為人類智能的核心。當我們看到“狗”“汽車”或“蘋果”時,不僅能識別它們的物理特征(尺寸、顏色、形狀等),還能理解其功能、情感價值和文化意義——這種多維度的概念表征構成了人類認知的基石。隨著ChatGPT等大語言模型(LLMs)的爆發式發展,一個根本性問題浮出水面:這些大模型能否從語言和多模態數據中發展出類似人類的物體概念表征?

    近日,中國科學院自動化研究所神經計算與腦機交互(NeuBCI)課題組與中國科學院腦科學與智能技術卓越創新中心的聯合團隊結合行為實驗與神經影像分析,首次證實多模態大語言模型(MLLMs)能夠自發形成與人類高度相似的物體概念表征系統。這項研究不僅為人工智能認知科學開辟了新路徑,更為構建類人認知結構的人工智能系統提供了理論框架。相關研究成果以Human-like object concept representations emerge naturally in multimodal large language models為題,發表于《自然·機器智能》(Nature Machine Intelligence)。


    從“機器識別”到“機器理解”的跨越

    傳統人工智能研究聚焦于物體識別準確率,卻鮮少探討模型是否真正“理解”物體含義。論文通訊作者何暉光研究員指出:“當前AI能區分貓狗圖片,但這種‘識別’與人類‘理解’貓狗的本質區別仍有待揭示。”團隊從認知神經科學經典理論出發,設計了一套融合計算建模、行為實驗與腦科學的創新范式。研究采用認知心理學經典的“三選一異類識別任務”(triplet odd-one-out),要求大模型與人類從物體概念三元組(來自1854種日常概念的任意組合)中選出最不相似的選項。通過分析470萬次行為判斷數據,團隊首次構建了AI大模型的“概念地圖”。

    實驗范式示意圖。a,物體概念集及帶有語言描述的圖像示例。

    b-d,分別針對 LLM、MLLM 和人類的行為實驗范式和概念嵌入空間。


    核心發現:AI的“心智維度”與人類殊途同歸

    研究人員從海量大模型行為數據中提取出66個“心智維度”,并為這些維度賦予了語義標簽。研究發現,這些維度是高度可解釋的,且與大腦類別選擇區域(如處理面孔的FFA、處理場景的PPA、處理軀體的EBA)的神經活動模式顯著相關。

    研究還對比了多個模型在行為選擇模式上與人類的一致性(Human consistency)。結果顯示,多模態大模型(如?Gemini_Pro_Vision、Qwen2_VL)在一致性方面表現更優。此外,研究還揭示了人類在做決策時更傾向于結合視覺特征和語義信息進行判斷,而大模型則傾向于依賴語義標簽和抽象概念。本研究表明大語言模型并非“隨機鸚鵡”,其內部存在著類似人類對現實世界概念的理解。

    自動化所副研究員杜長德為論文第一作者,何暉光研究員為論文通訊作者。主要合作者還包括腦智卓越中心的常樂研究員等。該研究得到了中國科學院基礎與交叉前沿科研先導專項、國家自然科學基金、北京市自然科學基金項目以及腦認知與類腦智能全國重點實驗室的資助。


    論文信息:

    Changde Du,Kaicheng Fu,Bincheng Wen,Yi Sun,Jie Peng,Wei Wei,Ying Gao,Shengpei Wang,Chuncheng Zhang,Jinpeng Li,Shuang Qiu,Le Chang,Huiguang He. Human-like object concept representations emerge naturally in multimodal large language models. Nature Machine Intelligence (2025).

    DOI:10.1038/s42256-025-01049-z

    全文鏈接

    代碼

    數據集


    來源:中國科學院自動化研究所


    熱點新聞

    推薦產品

    x
    • 在線反饋
    1.我有以下需求:



    2.詳細的需求:
    姓名:
    單位:
    電話:
    郵件: