繼大模型后,“具身智能”成為今年科技界的新熱點(diǎn),被認(rèn)為是新一波人工智能(AI)浪潮中的重點(diǎn)方向。眾多初創(chuàng)公司涌現(xiàn)、融資屢創(chuàng)新高、技術(shù)不斷突破……人形機(jī)器人作為該領(lǐng)域最具代表性的實(shí)體,正在大模型催化下加速產(chǎn)業(yè)化落地。
如果將大模型視為“有趣的靈魂”,“具身智能”賦能的人形機(jī)器人則有了“好看的皮囊”,已在多個領(lǐng)域成為人類的有力助手。
重新定義機(jī)器人
作為連接虛擬空間和現(xiàn)實(shí)空間的橋梁,“具身智能”是指將AI融入機(jī)器人等物理實(shí)體,賦予它們像人一樣感知、學(xué)習(xí)和與環(huán)境動態(tài)交互的能力。
“具身智能”一詞本身具有濃厚的技術(shù)哲學(xué)色彩。1945年,法國哲學(xué)家莫里斯·梅洛-蓬蒂提出“具身性”概念,認(rèn)為人類需通過身體與周圍環(huán)境進(jìn)行互動和感知,進(jìn)而理解世界。1950年,被稱為“AI之父”的英國計算機(jī)科學(xué)家圖靈在論文《計算機(jī)器與智能》中首次提出“具身智能”這一概念。
事實(shí)上,智能化水平相對較低的工業(yè)機(jī)器人(機(jī)械臂)早已在制造業(yè)廣泛應(yīng)用,帶來質(zhì)效提升。但傳統(tǒng)工業(yè)機(jī)器人是“固定程序+機(jī)械臂”的組合,而“具身智能”賦能的機(jī)器人則是“多模態(tài)感知+大腦決策”的迭代。
清華大學(xué)交叉信息研究院助理教授許華哲認(rèn)為,未來機(jī)器人將呈現(xiàn)多姿多彩的形態(tài):雙足、四足、輪式,機(jī)械狗、智能無人機(jī)甚至機(jī)械小蜜蜂,但人形機(jī)器人對人類社會適配性最佳,將成為最能夠幫助人類的機(jī)器人。
人形機(jī)器人可解決生產(chǎn)線“最后一公里”的問題。很多個性化、定制化的產(chǎn)品無法靠流水線統(tǒng)一組裝,這就需要具有泛化能力的人形機(jī)器人來“幫忙”,把批量生產(chǎn)的零部件按客戶的定制需求組裝成產(chǎn)品。在家庭服務(wù)、公共服務(wù)等更復(fù)雜多變的場景中,人形機(jī)器人也更具優(yōu)勢,可適應(yīng)不同的環(huán)境和需求完成多種任務(wù)。
三大難點(diǎn)待突破
人形機(jī)器人研發(fā)始于對人類的學(xué)習(xí)與模仿,其研發(fā)難點(diǎn)也可以比照人類的大腦、小腦和本體來理解。“大腦”主要是機(jī)器人負(fù)責(zé)自主學(xué)習(xí)、規(guī)劃和決策的中樞;“小腦”負(fù)責(zé)運(yùn)動控制,包括從行走到跑跳,以及從簡單抓取到復(fù)雜的手部動作等;而“本體”部分則包括軀干四肢結(jié)構(gòu)和靈巧手設(shè)計。
優(yōu)必選科技副總裁、研究院院長焦繼超告訴記者,目前這三大領(lǐng)域都有較多技術(shù)難點(diǎn)有待突破:“大腦”方面,云邊端一體計算架構(gòu)、多模態(tài)感知與環(huán)境建模等是近年技術(shù)焦點(diǎn),“仿人最大難點(diǎn)在于對人腦的模仿,現(xiàn)有科學(xué)理論對人腦的研究遠(yuǎn)遠(yuǎn)不足”;“小腦”方面,人機(jī)交互能力、復(fù)雜地形通過、全身協(xié)同精細(xì)作業(yè)等是重要方向;“本體”方面,剛?cè)狁詈戏律鷤鲃訖C(jī)構(gòu)、高緊湊機(jī)器人四肢結(jié)構(gòu)與靈巧手設(shè)計等關(guān)鍵技術(shù),是人形機(jī)器人靈活運(yùn)動所需的重要硬件基礎(chǔ)。
大模型的出現(xiàn)讓機(jī)器人“大腦”顯著“進(jìn)化”,大大提升了機(jī)器人的通用性和泛化性,有望降低人形機(jī)器人開發(fā)成本,加速其走入千家萬戶。
據(jù)優(yōu)理奇機(jī)器人科技公司創(chuàng)始人兼首席執(zhí)行官楊豐瑜介紹,現(xiàn)在業(yè)界主要使用預(yù)訓(xùn)練大模型對機(jī)器人進(jìn)行預(yù)訓(xùn)練,讓其具備更強(qiáng)學(xué)習(xí)能力;大模型可將特定任務(wù)的學(xué)習(xí)遷移到機(jī)器人任務(wù)上,提高其適應(yīng)能力;另外還可利用大模型的多模態(tài)處理能力,結(jié)合視覺、聽覺、觸覺等各種輸入,提升機(jī)器人對復(fù)雜場景的理解。
中國起跑不落后
環(huán)顧全球,人形機(jī)器人已進(jìn)入產(chǎn)業(yè)化落地初期階段,在工業(yè)制造、商用服務(wù)和家庭陪伴領(lǐng)域開始“試水”。無論是技術(shù)突破、落地進(jìn)展還是融資規(guī)模,人形機(jī)器人研發(fā)競賽基本以中美為主導(dǎo)。
優(yōu)必選人形機(jī)器人Walker今年聚焦汽車、消費(fèi)電子等制造業(yè)重點(diǎn)領(lǐng)域,已進(jìn)入多家車廠實(shí)訓(xùn);宇樹科技的機(jī)器人實(shí)現(xiàn)了完全仿人的自然行走;優(yōu)理奇機(jī)器人正在醞釀“進(jìn)家”計劃;波士頓動力的新版Atlas機(jī)器人實(shí)現(xiàn)了在工廠中不同儲物柜之間靈活搬動零件;特斯拉人形機(jī)器人“擎天柱”計劃2025年開始量產(chǎn)……
焦繼超說:“如果把人形機(jī)器人行業(yè)比喻成一場馬拉松,中國和歐美國家,目前幾乎都處在前面1000米的起跑階段。”
楊豐瑜持同樣觀點(diǎn),大模型研發(fā)能力、感知技術(shù)的領(lǐng)先使美國企業(yè)在機(jī)器人決策系統(tǒng)和復(fù)雜任務(wù)處理方面具有更強(qiáng)競爭力。而中國的優(yōu)勢更多體現(xiàn)在工業(yè)機(jī)器人領(lǐng)域,特別是在制造業(yè)中的應(yīng)用較為成熟。在人形機(jī)器人技術(shù)專利方面,中國也已走在前列。
雖然機(jī)器人“大腦”的核心算法和高端芯片仍存在挑戰(zhàn),但中國機(jī)器人行業(yè)擁有豐富的應(yīng)用場景和龐大的潛在用戶人口,數(shù)據(jù)是最大競爭優(yōu)勢之一。
如何在真實(shí)世界場景中采集大量數(shù)據(jù),并將數(shù)據(jù)統(tǒng)籌流通和供給人形機(jī)器人行業(yè)是關(guān)鍵。許華哲介紹說,真實(shí)世界的數(shù)據(jù)一般都靠各家機(jī)器人公司自己采集。北京人形機(jī)器人創(chuàng)新中心有限公司正計劃打造一個開源數(shù)據(jù)集供學(xué)界和業(yè)界使用。未來,高質(zhì)量的共享數(shù)據(jù)集將大大助力行業(yè)發(fā)展。