在2024世界機器人大會上,27款人形機器人進行了整機展示,數(shù)量創(chuàng)歷屆之最。記者在現(xiàn)場看到,幾乎每個人形機器人的展位都圍滿了觀眾。
除了與人外表相似之外,人形機器人在工業(yè)和商業(yè)等場景已有廣泛應用。人形機器人如何在不同場景中完成工作任務?人形機器人與人的互動如何實現(xiàn)?在上崗前,它們需要經(jīng)過哪些“考試”?
上崗工作:基于模型的運動控制或通過模仿學習
2024世界機器人大會上,中國兵器裝備集團自動化研究所有限公司展出了D11智能人形機器人,這款機器人具備擬人的形態(tài)、移動能力和操作能力,今年7月進入一家3C智能制造企業(yè)產(chǎn)業(yè)園內(nèi)的5G+工業(yè)互聯(lián)網(wǎng)生產(chǎn)線,承擔物料搬運、掃碼貼簽等工作。
D11智能人形機器人正在搬運物料。受訪者供圖
“以工業(yè)制造場景中常見的掃碼、貼標工序為例,人形機器人通過視覺對目標物進行識別,并反饋位置信息,控制機器人的手臂進行抓取、粘貼、掃描等一系列動作?!敝袊餮b備集團自動化研究所有限公司工程師張嘯甫表示,人形機器人有兩種方式完成這些操作,一種是基于模型的運動控制,另一種則是通過模仿學習進行訓練。
“基于模型的運動控制,需要設計一些程序讓機器人完成識別、抓取、放置等動作,屬于硬編碼,關鍵在于算法控制精度、環(huán)境感知精度等方面?!睆垏[甫介紹,人形機器人通過這種方式完成任務的穩(wěn)定可靠性較高,但在泛化性方面有所局限,即一旦工作場景和任務內(nèi)容改變,就需要重新編碼設計,且面對較復雜的操作任務時,開發(fā)任務較繁重。
D11智能人形機器人正在掃碼貼簽。受訪者供圖
模仿學習在跨任務推廣、復雜技能泛化方面優(yōu)勢突出,但前期數(shù)據(jù)采集和穩(wěn)定訓練難度較大,目前難以穩(wěn)定、可靠地完成任務。模仿學習前期通過遙操作等方式,讓人形機器人在復雜場景下完成演示任務,并收集過程數(shù)據(jù),“比如關節(jié)數(shù)據(jù)、圖像數(shù)據(jù)等,將這些信息積累成龐大的數(shù)據(jù)集,再用數(shù)據(jù)集進行訓練,讓機器人‘理解’如何在不同場景中完成操作任務。只要將這個模型訓練出來,人形機器人就能較快投入到對應的工作場景中。但是要實現(xiàn)高泛化性和高成功率,數(shù)據(jù)采集的成本目前非常高?!睆垏[甫說,這兩種方式業(yè)內(nèi)都在研發(fā),“長遠來看,人形機器人執(zhí)行復雜操作任務,模仿學習會是未來發(fā)展的趨勢,只是目前由于一些限制,無法完全把優(yōu)勢發(fā)揮出來?!?br>
與人交互:識別指令并調(diào)用大模型
在教育、文旅、商業(yè)等領域,人形機器人能和人打招呼,并針對特定領域進行交流。例如,大會上展出的青少年孿生人形機器人“躍遷”,有著孩童的外觀,可以在兒童的啟蒙教育階段提供有情緒價值的問答內(nèi)容。EX仿生人形機器人中有一款外形是蘇軾的交互型仿生人形機器人,通過對古代文學、歷史知識、人物經(jīng)歷的深度學習,能夠復現(xiàn)蘇軾的詩文和思想,可以在歷史文化景區(qū)和游客互動。來自上海清蕓機器人有限公司的“清寶”機器人,不僅可以快速根據(jù)問題給出答案,還能在接收指令后動嘴唱歌,并揮舞雙手做出舞蹈動作。
8月21日,小朋友和身著漢服的人形仿生機器人“蘇軾”打招呼。新京報記者 李木易 攝
上海清蕓機器人有限公司副總裁張杰東告訴記者,對大模型的調(diào)用,是人形機器人實現(xiàn)與人交互的關鍵。在語音交互過程中,人形機器人接收人的語音指令,將其轉(zhuǎn)化成文本指令,再調(diào)用大模型中的文本指令實現(xiàn)語音輸出,達成與人對話的目的。交互中伴隨的表情和動作,也是相同的實現(xiàn)路徑。
“這個過程雖然有好幾個步驟,但我們?nèi)诵螜C器人的反饋速度很快,大模型的調(diào)用通常能在1秒左右完成,如果網(wǎng)絡存在延遲,可能會是2秒左右,基本上和人在交流中的反饋速度相當?!睆埥軚|表示,“大模型需要不斷修正和完善,我們的人機交互技術(shù)已經(jīng)過三年迭代,達到業(yè)內(nèi)優(yōu)秀水平?!?/p>
崗前考試:重要部位逐項測試
人形機器人在“上崗”之前需要完成一系列“考試”,考試環(huán)節(jié)設計有核心零件、運動控制、適應性與可靠性、智能化、安全性能、通信性能等多個方面。
和人一樣,關節(jié)、手指等都是人形機器人身體的一部分,要讓機器人“健康”,每個部分的“考試”都得達標。
記者從北京具身智能機器人創(chuàng)新中心了解到,人形機器人一體化關節(jié)作為機器人運動系統(tǒng)的核心部件,其性能直接影響機器人的整體表現(xiàn),包括動作精準度、靈活性、安全性及能效等,因此技術(shù)人員要對機器人的關節(jié)開展一系列測試,包括絕對定位精度、重復定位精度、穩(wěn)態(tài)誤差、振動等。
據(jù)介紹,當前技術(shù)下,人形機器人一體化關節(jié)的絕對定位精度普遍較高,一般而言,高端機器人關節(jié)的絕對定位精度可達到0.01°-0.1°,甚至部分頂尖產(chǎn)品能達到0.001°或更高的精度。這種高精度確保了人形機器人在執(zhí)行精細操作時的準確性和可靠性。
在現(xiàn)有技術(shù)條件下,人形機器人一體化關節(jié)的重復定位精度通常優(yōu)于絕對定位精度,高端機型的重復定位精度可達到0.005°以內(nèi)。這意味著機器人在多次執(zhí)行相同動作時,能夠保持極高的位置一致性,從而提高工作效率和產(chǎn)品質(zhì)量。
隨著機器人產(chǎn)業(yè)的不斷發(fā)展,機器人的“手”越來越靈活,測試人員對其的測試也十分嚴格,測試主要包括抓握力量、動作精度和靈活性。通過對這些指標的測試和優(yōu)化,可以顯著提升人形機器人的任務執(zhí)行能力、精度和適應性,擴展其應用領域和場景。
8月21日,“天工”人形機器人在和觀眾一起巡館。新京報記者 李木易 攝
“天工”是本次機器人大會的明星機器人,其引人矚目的能力是可以穩(wěn)定小跑,同時具備爬坡等能力,讓它更像人類。在這些能力的背后,機器人需要完成一系列運動控制測試,比如行走、奔跑、攀越、跳躍、蹲起、轉(zhuǎn)彎、可通行性和腿部靈活性。人形機器人不僅要走得穩(wěn),還得走得巧,這就意味著機器人得學會轉(zhuǎn)彎。在機器人的轉(zhuǎn)彎能力測試中,包括了特定的轉(zhuǎn)彎類型,比如U形轉(zhuǎn)彎、三點轉(zhuǎn)彎和L形轉(zhuǎn)彎。
“上崗”前有了新“考場”
人形機器人崗前考試的“考場”既可以在研發(fā)機構(gòu),也可以在測評中心。國家機器人檢測與評定中心(總部)北京測評中心在本次機器人大會期間全新亮相,它同樣是人形機器人“上崗”前的“考場”之一。
該中心負責人柴熠介紹,北京測評中心智能化評價試驗室一期建成了智能感知、認知決策試驗室和交互試驗室。目前感知試驗室可依據(jù)相關標準要求,開展機器人視覺算法測試和視覺模擬測試?!耙曈X是機器人重要的感知方式。視覺算法測試是通過連接被測樣品,導入算法模型,依據(jù)被測樣品的應用場景,選擇對應測試數(shù)據(jù)集進行視覺算法測試,測試系統(tǒng)會自動輸出視覺算法智能等級測試結(jié)果。”
移動能力是不同應用場景中機器人最重要的認知決策能力。在認知決策試驗室,機器人將進行移動算法測試和移動實物測試。
交互能力對人形機器人或室外移動機器人都至關重要。在交互試驗室,人形機器人將開展交互能力的測試評價,包括上肢測試系統(tǒng)和下肢測試系統(tǒng)。柴熠介紹,上肢測試系統(tǒng)可測試人形機器人在與人類交互時的操作交互性能、力控性能及柔順性能等,通過一系列參數(shù)指標,評估人與人形機器人交互的安全性、柔順性和智能化。
新京報記者 葉紅梅 吳婷婷
編輯 白爽 校對 楊許麗