近年來,“具身智能”這個(gè)詞頻繁出現(xiàn)在各大科技論壇、政策文件和投資報(bào)告中。2025年,它次被寫入ZG政府工作報(bào)告和“十五五”規(guī)劃。全國(guó)20多個(gè)省市陸續(xù)出臺(tái)專項(xiàng)政策,資本蜂擁而至,機(jī)器人公司如雨后春筍般涌現(xiàn)。
那么,具身智能到底是什么?它為什么突然火了?我們又該如何看待它的技術(shù)趨勢(shì)和產(chǎn)業(yè)落地?
中山大學(xué)王可澤教授在《具身智能技術(shù)及產(chǎn)業(yè)實(shí)踐的階段性進(jìn)展》報(bào)告中,給出了系統(tǒng)性、前瞻性的回答。
具身智能發(fā)展趨勢(shì): 隨著大模型技術(shù)的興起,具身智能技術(shù)得到了快速發(fā)展,并在2025年被寫入ZG政府工作報(bào)告和十五五規(guī)劃,成為戰(zhàn)略重點(diǎn)。
具身智能定義: 具身智能是指智能體通過物理實(shí)體與環(huán)境實(shí)時(shí)交互,實(shí)現(xiàn)感知、認(rèn)知、決策、行動(dòng)一體化的智能系統(tǒng),是AI從虛擬走向物理的關(guān)鍵跨越。
具身智能核心難點(diǎn): 當(dāng)前具身智能發(fā)展面臨平臺(tái)與數(shù)據(jù)缺失、感知與決策難等核心難點(diǎn)。
具身智能研究進(jìn)展: 介紹了中山大學(xué)在具身智能領(lǐng)域的研究進(jìn)展,包括高效超長(zhǎng)序列建模世界模型基礎(chǔ)架構(gòu)、物理規(guī)則驅(qū)動(dòng)的空間感知與推理、大模型內(nèi)在機(jī)理驅(qū)動(dòng)的多智能體協(xié)同、高質(zhì)量具身數(shù)據(jù)生成與仿真、具身智能通用數(shù)據(jù)標(biāo)準(zhǔn)及數(shù)據(jù)集、基準(zhǔn)與評(píng)測(cè)等方面。
具身智能產(chǎn)業(yè)實(shí)踐: 分析了具身智能產(chǎn)業(yè)發(fā)展的時(shí)代背景、發(fā)展背景、發(fā)展挑戰(zhàn)和人才需求,并提出了打造具身智能教學(xué)實(shí)訓(xùn)基地的方案,以培養(yǎng)具身智能應(yīng)用人才,推動(dòng)區(qū)域產(chǎn)業(yè)智能變革。
1. 高效超長(zhǎng)序列建模世界模型
• 構(gòu)建顯式語義概念體系,提升生成過程的可控性。
• 在one-hot單純形上實(shí)現(xiàn)嚴(yán)格擴(kuò)散過程,表現(xiàn)L先現(xiàn)有方法40%。
2. 物理規(guī)則驅(qū)動(dòng)的空間感知與推理
• 實(shí)現(xiàn)“把浴袍掛在掛鉤上”這種推理能力。
• 支持復(fù)雜導(dǎo)航任務(wù),如安防巡檢、多智能體協(xié)作。
3. 多智能體協(xié)同框架
• 智能體動(dòng)態(tài)分工、角色分化,協(xié)作成功率提升51%,幻覺率減少11%。
• 性能隨智能體規(guī)模穩(wěn)定增長(zhǎng),優(yōu)于斯坦福同期工作。
4. 高質(zhì)量具身數(shù)據(jù)生成與仿真
• 構(gòu)建Z大開源具身數(shù)據(jù)集:ARIO(All Robots In One)。
• 300多萬條操作軌跡,258個(gè)場(chǎng)景,32萬個(gè)任務(wù)。
• 支持室內(nèi)、室外、桌面、機(jī)器人控制等多種場(chǎng)景。
附件:具身智能技術(shù)及產(chǎn)業(yè)實(shí)踐的階段性進(jìn)展-模型基礎(chǔ)架構(gòu)、物理規(guī)則驅(qū)動(dòng)的空間感知與推理、大模型內(nèi)在機(jī)理驅(qū)動(dòng)的多智能體協(xié)同

中國(guó)機(jī)器人和自動(dòng)駕駛市場(chǎng)規(guī)模合計(jì)將突破1.25萬億元(機(jī)器人6328億元+自動(dòng)駕駛6200億元),年復(fù)合增長(zhǎng)率超過20%;六大場(chǎng)景掘金圖,具身智能商業(yè)化場(chǎng)景劃分為六層梯隊(duì),每一層都有明確的訂單數(shù)據(jù)和落地深度
中國(guó)具身智能產(chǎn)業(yè)形成了"四大高地+特色節(jié)點(diǎn)"的空間格局;預(yù)計(jì)2026年將達(dá)到10904億元,2027年突破1.25萬億元;2030年市場(chǎng)規(guī)模有望達(dá)4000億元
具身智能產(chǎn)業(yè)要邁向萬億級(jí)規(guī)模,必然需要類似于通用操作系統(tǒng)之于計(jì)算機(jī)產(chǎn)業(yè)那樣的共性基礎(chǔ)設(shè)施,將機(jī)器人硬件與軟件解耦,支撐生態(tài)化分工、跨平臺(tái)復(fù)用與規(guī)模化應(yīng)用
中國(guó)四足機(jī)器人市場(chǎng)規(guī)模約50億元人民幣,全球市場(chǎng)約70億元人民幣;從事四足機(jī)器人研發(fā)、整機(jī)制造及系統(tǒng)集成的主體已經(jīng)超過100家;區(qū)域集群化明顯的發(fā)展格局
數(shù)據(jù)范式正在發(fā)生結(jié)構(gòu)性變革,五大趨勢(shì)共同將數(shù)據(jù)成本曲線從線性壓向次線性;具身智能正從單點(diǎn)技術(shù)驗(yàn)證走向全流程自主作業(yè),在五大領(lǐng)域形成明確落地路徑
集聚焦上海智能機(jī)器人標(biāo)桿企業(yè)近年來重點(diǎn)探索和突破的創(chuàng)新示范應(yīng)用場(chǎng)景,涵蓋制造業(yè)、醫(yī)療健康、安全應(yīng)急和極限環(huán)境、商業(yè)社區(qū)服務(wù)、 建筑、商貿(mào)物流、養(yǎng)老助殘、教育、農(nóng)業(yè)、交通運(yùn)輸?shù)冉?jīng)濟(jì)發(fā)展與社會(huì)民生重要領(lǐng)域,遴選具有示范性、創(chuàng)新性和可復(fù)制性的項(xiàng)目案例
真實(shí)數(shù)據(jù)采集方式主要分為VR遙操作采集、 機(jī)械臂主從控制采集、數(shù)據(jù)手套遙操作等。目前主流廠家數(shù)據(jù)采集及訓(xùn)練方案多樣,特斯拉數(shù)采方案或轉(zhuǎn)向視頻學(xué)習(xí),而銀河通用以物理仿真數(shù)據(jù)為主、真實(shí)數(shù)據(jù)為輔
具身智能正在重演大語言模型的"數(shù)據(jù)故事",數(shù)據(jù)從文本 token 變?yōu)槎嗄B(tài)的"狀態(tài)-動(dòng)作-反饋"軌跡,發(fā)展具身智能是多領(lǐng)域融合的系統(tǒng)性工程,數(shù)據(jù)是跨領(lǐng)域的真實(shí)樞紐,貫穿全部鏈條
報(bào)告梳理了全球30家主要人形機(jī)器人公司的產(chǎn)品、技術(shù)特點(diǎn)及發(fā)展進(jìn)度。報(bào)告分為國(guó)內(nèi)篇和海外篇,涵蓋企業(yè)從研發(fā)到試點(diǎn)應(yīng)用的全階段信息
宇樹科技已于2026年3月20日正式向上交所科創(chuàng)板提交IPO申請(qǐng)并獲受理;樂聚智能(深圳)股份有限公司在深圳證監(jiān)局辦理輔導(dǎo)備案登記;杭州云深處科技股份有限公司向浙江證監(jiān)局提交IPO輔導(dǎo)備案
2025年人形機(jī)器人出貨量約1.7萬臺(tái),市場(chǎng)規(guī)模達(dá)到28.8億元;從"技術(shù)驗(yàn)證"階段向"價(jià)值驗(yàn)證"新周期的關(guān)鍵跨越;實(shí)現(xiàn)了從"能造"到"量產(chǎn)"的質(zhì)變;人形機(jī)器人訂單數(shù)突破50筆,訂單總額超過45億
工業(yè)制造是當(dāng)前具身智能機(jī)器人最具落地潛力的領(lǐng)域,已在物流倉儲(chǔ)、汽車、3C 電子、家電、食品包裝等行業(yè)實(shí)現(xiàn)局部替代,典型任務(wù)包括 注塑、搬運(yùn)、分揀、物流運(yùn)輸、精密裝配(小部件)、巡檢、打磨拋光及質(zhì)檢等