人形機器人擁有聰慧的“大腦”、敏捷的“小腦”、靈活的“肢體”,是通用人工智能的理想載體,蘊藏著巨大的市場空間和發(fā)展機遇。在今年的機器人博覽會上,共有27款人形機器人亮相,讓觀眾感覺離未來又近了一步。

 

人形機器人發(fā)展還面臨哪些挑戰(zhàn)?未來它們有哪些終極應用場景?對此,新京報記者采訪了北京郵電大學人工智能學院教授方斌,北京航空航天大學副教授、博士生導師陶永,北京具身智能機器人創(chuàng)新中心數(shù)據(jù)智能負責人李廣宇。


8月22日,2024世界機器人大會機器人博覽會,“天工”人形機器人被團團簇擁。新京報記者 李木易 攝


問題1

人形機器人有何特點?它和具身智能的關系是什么?

 

方斌表示,人形機器人在形態(tài)上仿人。一方面是移動能力,像人下肢一樣運動;另一方面是仿人手臂的靈巧操作能力。具身智能是機器人本體和人工智能結合形成的物理閉環(huán)系統(tǒng)。人形機器人是具身智能非常典型的應用。由于人工智能僅依靠數(shù)據(jù)和算力,所以迭代的速度比機器人本體更快一些。

 

陶永認為,更寬泛的人形機器人還有環(huán)境感知能力和人機交互能力。

 

李廣宇介紹,人形機器人相當于是具身智能機器人的一個典型應用示范。首先在技術上是高地,如果把人形機器人的技術問題都解決的話,可以向下兼容其他類型的機器人,比如把腿換成輪式底盤,這就是現(xiàn)在比較流行的輪臂機器人。

 

在通用性上,世界上大部分的設計都是以人為核心用戶,所以做人形機器人在細分場景的效率不一定最高,但泛化性和通用性是最好的。從倫理的角度來說,人形機器人更能和人產(chǎn)生情感的共鳴。

 

問題2

人形機器人“大腦”“小腦”的作用是什么?

 

陶永介紹,人形機器人擁有聰慧的“大腦”、敏捷的“小腦”、靈活的“肢體”?!按竽X”作為人形機器人控制系統(tǒng)的中心,承擔著類似于人類大腦的復雜認知和決策功能。基于通用大模型、數(shù)據(jù)集、高效計算架構、多模態(tài)融合感知等關鍵技術,“大腦”使人形機器人具備了學習與適應能力,使其能夠處理基本運算、圖像處理、視覺識別、決策規(guī)劃和智能決策。

 

“小腦”在人形機器人運動控制與協(xié)調方面發(fā)揮重要作用,是實現(xiàn)精確動作的保證?!靶∧X”由傳感器融合模塊、動力學模型和控制器等組成,制定運動策略,確保機器人動作的流暢性和穩(wěn)定性。

 

問題3

近幾年,人形機器人的熱度為何這么高?

 

陶永表示,特斯拉等公司研發(fā)的人形機器人向大眾展示了它的潛力,引起了關注。人形機器人搭建了一個通用的平臺,可以將人工智能、大模型技術遷移到人形機器人上進行驗證,比如將汽車上基于視覺的環(huán)境識別、避障運動、路徑規(guī)劃的功能遷移到機器人上后,將發(fā)揮更大的優(yōu)勢。

 

在相關領軍企業(yè)的推動下,人形機器人的技術正在加速迭代、快速研發(fā),硬件成本不斷降低,有望更廣泛地出現(xiàn)在檢測、搬運等場景中。

 

李廣宇認為,這很大程度上歸功于大模型發(fā)展突飛猛進,特別是過去兩三年,從ChatGPT的發(fā)布到最近多模態(tài)大模型的進展,都遠遠超出業(yè)界預期,已經(jīng)走向公眾視野。但大模型畢竟是在軟件層面,和現(xiàn)實的物理世界缺少交互媒介,所以業(yè)界希望給通用的人工智能加一個身體,也就是具身智能。

 

另外,這也歸功于國內多年來產(chǎn)業(yè)鏈的發(fā)展,包括傳感器技術、電機技術等,使人形機器人研發(fā)門檻降低。同時,國家在政策引導方面對人形機器人產(chǎn)業(yè)給予了較大支持。

 

問題4

人形機器人和工業(yè)機器人等相比有何優(yōu)勢?

 

陶永認為,人形機器人可以適應復雜地形,比如在電力巡檢過程中,輪式機器人邁不過去的臺階,人形機器人可以上得去。另外,人形機器人上肢有更多自由度,可以實施精確操作。

 

李廣宇表示,工業(yè)機器人重復定位精度非常高,但沒有泛化性,基本按照編程重復進行。人形機器人既有移動能力,也有操作能力,其泛化性帶來了通用能力的預期,在物料分揀、上下貨等環(huán)節(jié)可以對工業(yè)機器人進行補位。


GALBOT G1人形機器人展示超市工作場景。新京報記者 李木易 攝


問題5

發(fā)展人形機器人還有哪些技術需要突破?

 

人形機器人不僅使用了計算芯片、存儲芯片、控制芯片、觸覺傳感器,還應用了各類軟件、各類關節(jié)、伺服電機、人造皮膚等新材料。

 

方斌說,目前,經(jīng)過人形機器人這波熱潮,小型化的電機、驅控一體化的關節(jié)相對成熟了不少。受限的在于關鍵的傳感器件,包括類似于人皮膚的觸覺傳感器,類似人手的靈巧手操作末端,和人類相比還欠缺很多。比如在手機裝配線上,工人可以熟練地進行精細的工業(yè)裝配,但人形機器人還完成不了這些任務。

 

陶永也表示,從硬件上來說,高能量密度小體積的關節(jié)、低成本的傳感器等仍需提升。軟件方面,要實現(xiàn)人形機器人在草地、沙地、崎嶇路面的穩(wěn)定行走,目前有基于步態(tài)的虛擬仿真訓練平臺進展較快,但仍然需要不斷完善。

 

他說,目前人形機器人價格偏高,未來,隨著硬件價格和軟件研發(fā)成本降低,應用場景日漸成熟,人形機器人有望批量化生產(chǎn),價格下降。

 

李廣宇表示,“大腦”部分得益于大模型的發(fā)展,比“小腦”和“本體(肢體)”更成熟一點,主要負責人機交互和日常任務的規(guī)劃拆解?!靶∧X”負責具體執(zhí)行,目前業(yè)內正在嘗試不同技術路線的方向,還需要一定的探索。

 

“本體(肢體)”包括上肢、下肢和傳感器三個方面。在上肢方面,多關節(jié)、多自由度的機械臂發(fā)展得相對成熟,但上肢末端靈巧手的精細操作需要快速迭代。通過近些年四足機器人的發(fā)展,下肢研發(fā)的進展比較快。傳感器方面,視覺傳感器比較成熟,末端的觸覺傳感器在不斷迭代當中。未來,人形機器人將走多模態(tài)傳感器融合的路線,所以不同種類的傳感器都需快速發(fā)展。

 

問題6

人形機器人要實現(xiàn)成熟應用還面臨哪些挑戰(zhàn)?

 

方斌說,人形機器人整體運動的敏捷性仍有所欠缺,在通用場景下執(zhí)行任務的操作能力有待提升。人工智能和本體的系統(tǒng)集成能力還需要進一步發(fā)展。

 

要增加人形機器人運動的感知能力,通過深度強化學習增加抗干擾性,使人工智能算法和機器人本體的結構控制耦合得更緊密。

 

李廣宇表示,具身智能的數(shù)據(jù)比較稀缺,是制約產(chǎn)業(yè)發(fā)展的一個關鍵因素。目前,北京具身智能機器人創(chuàng)新中心正牽頭建設人形機器人世界上規(guī)模最大、信息最稠密、最通用的高質量具身智能數(shù)據(jù)集。為推動行業(yè)加快發(fā)展,創(chuàng)新中心還公布了“百臺天工計劃”,將向重點科研機構與高校提供超百臺“天工”系列機器人,共同探索機器人在各種細分場景中如何更好落地。


小朋友和有陪伴功能的人形機器人對話。新京報記者 李木易 攝


問題7

人形機器人的終極應用場景包括哪些?多久可以實現(xiàn)?

 

陶永認為,人形機器人正處于核心技術快速突破階段。在未來10年里,人形機器人有望在惡劣和特殊環(huán)境下,代替人類進行值守、巡邏和作業(yè)。同時,在關鍵技術突破的情況下,人形機器人可能在智能工廠進行巡檢、加工、檢測。另外,它們或將應用在教育中,在大學中成為實驗平臺。在更遠的未來,人形機器人也有可能進入公共場所或者家庭,進行陪護。

 

方斌認為,人形機器人作為通用的具身智能本體,未來就像人類職業(yè)分工一樣,可以應用于不同場景,有的做醫(yī)生,有的當廚師,有的在生產(chǎn)線上做工人,有的做家政護理等。在家庭應用方面,由于老人、兒童對人形機器人的安全性要求更高,它有可能率先在中青年家庭中應用清潔打掃功能。

 

問題8

科幻片中非常逼真的仿生人形機器人何時才能實現(xiàn)?有哪些關鍵技術要突破?

 

陶永說,這一場景還比較遙遠,比如仿生機器人手眼協(xié)同能力還需要提升,做飯、疊衣服、裝配零件,這些日常操作對人來說很容易,但對機器人來說,涉及視覺、手臂末端觸覺力、運動控制協(xié)調等,都要仿人的智能化程度來實現(xiàn),中間有很多關鍵技術需要突破。

 

比如仿生人形機器人的面部表情,如果做不好會給人帶來恐怖的感覺,電子皮膚也要像人類皮膚一樣有感知、交互功能,這些都需要一點點攻克。未來,仿生人形機器人有望在展覽、科普場館中率先使用。

 

新京報記者 張璐

編輯 白爽 校對 楊許麗