2024-12-29
12月25日,《人民政協(xié)報》國是·科技文化版面以近二分之一版面刊登了對全國政協(xié)委員、天娛數(shù)科CEO賀晗關(guān)于人形機(jī)器人產(chǎn)業(yè)發(fā)展的專訪。采訪結(jié)合天娛數(shù)科在人形機(jī)器人,特別是3D數(shù)據(jù)集領(lǐng)域的技術(shù)積累和產(chǎn)業(yè)實(shí)踐,對人形機(jī)器人產(chǎn)業(yè)的新趨勢、發(fā)展機(jī)遇、技術(shù)創(chuàng)新、面臨的挑戰(zhàn)做了分析,并就推動人形機(jī)器人產(chǎn)業(yè)高質(zhì)量發(fā)展等進(jìn)行了深入交流探討。作為未來產(chǎn)業(yè)的前沿領(lǐng)域,人形機(jī)器人已成為全球科技和產(chǎn)業(yè)競爭的新賽道。天娛數(shù)科積極參與中國經(jīng)濟(jì)高質(zhì)量發(fā)展,通過一系列布局,加快實(shí)現(xiàn)人形機(jī)器人產(chǎn)業(yè)的健康、快速發(fā)展,助推人形機(jī)器人產(chǎn)業(yè)邁向新的高度。
2024年12月25日,《人民政協(xié)報》刊登了全國政協(xié)委員、天娛數(shù)科CEO賀晗的專訪
以下是專訪全文:
作為未來產(chǎn)業(yè)的前沿領(lǐng)域,人形機(jī)器人已成為全球科技和產(chǎn)業(yè)競爭的新賽道。近期,隨著特斯拉、OpenAI、英偉達(dá)等科技巨頭的加碼布局,人形機(jī)器人賽道迎來空前熱度。據(jù)GGII預(yù)測,2030年全球市場規(guī)模將突破200億美元,中國市場規(guī)模將達(dá)到50億美元左右。
那么,如何看待本輪的人形機(jī)器人熱?人形機(jī)器人會有怎樣的發(fā)展階段?記者采訪了全國政協(xié)委員、天娛數(shù)科CEO賀晗。
智能階段是發(fā)展方向
當(dāng)下人形機(jī)器人產(chǎn)業(yè)火熱,提及背后的原因,賀晗表示,火熱的背后是技術(shù)跨越帶來的產(chǎn)業(yè)變革浪潮。
“今年以來,大模型技術(shù)與機(jī)器人技術(shù)加速融合、進(jìn)化,使人形機(jī)器人成為具身智能的關(guān)鍵載體,為人形機(jī)器人帶來了革命性的變革,讓門檻大幅降低、場景快速增多,催生了‘研發(fā)熱’‘應(yīng)用熱’‘投資熱’?!辟R晗說。
據(jù)介紹,人形機(jī)器人的發(fā)展有三個階段:基于程序控制的演示階段、基于大模型的模仿階段和基于海量3D數(shù)據(jù)的智能階段。
賀晗表示,第一階段的人形機(jī)器人功能比較單一,只能完成一些預(yù)先設(shè)定的任務(wù),主要應(yīng)用于科技館、展覽會等場所,作為展示科技成果的工具;第二階段可以模仿學(xué)習(xí)技術(shù)讓人形機(jī)器人通過觀察和模仿人類的行為,直接從人類的示范中學(xué)習(xí)動作和技能,快速掌握一些復(fù)雜的操作,如穿衣、做飯、打掃衛(wèi)生等日常生活動作,以及特定領(lǐng)域的專業(yè)技能,如工業(yè)生產(chǎn)中的零件裝配、醫(yī)療護(hù)理中的簡單操作等;第三階段是今后的發(fā)展方向,從被動響應(yīng)和執(zhí)行到主動感知和決策。
“例如,在家庭陪伴場景中,機(jī)器人能夠利用3D空間數(shù)據(jù)理解家庭成員的行為,并通過世界模型進(jìn)行因果推理。如當(dāng)檢測到老人在客廳摔倒時,能夠迅速判斷位置并主動聯(lián)系急救人員,同時采取初步的急救措施。當(dāng)具身智能可以高度智能化地執(zhí)行與人類相同的任務(wù),則代表我們真正邁入了通用智能時代?!辟R晗說。
3D數(shù)據(jù)是關(guān)鍵資源
在賀晗看來,要實(shí)現(xiàn)人形機(jī)器人發(fā)展,3D數(shù)據(jù)是關(guān)鍵資源。
“3D數(shù)據(jù)對于提供真實(shí)人物、場景的展示、豐富的交互和決策支持至關(guān)重要,3D數(shù)據(jù)能讓AI對物理世界人與物的形態(tài)、結(jié)構(gòu)、位置、動作有更準(zhǔn)確的理解,可以在三維場景中像人類一樣對視覺信息進(jìn)行高級推理,超越二維視覺的局限。全球范圍內(nèi),3D數(shù)據(jù)都處于極端重要,又極端缺乏的狀態(tài)。3D數(shù)據(jù)集正在成為競爭的核心節(jié)點(diǎn)?!辟R晗說。
但賀晗也坦言,3D數(shù)據(jù)集的發(fā)展有兩個痛點(diǎn),一是3D數(shù)據(jù)的獲取與處理成本高昂、流程繁雜,需要大量的時間、人力與資金投入;二是3D數(shù)據(jù)的標(biāo)準(zhǔn)化程度低,導(dǎo)致數(shù)據(jù)的兼容性較差,共享和復(fù)用難度大。
為此,天娛數(shù)科在這方面也進(jìn)行了一系列布局。
據(jù)介紹,天娛數(shù)科通過一系列戰(zhàn)略投資,大幅降低了3D數(shù)據(jù)采集成本。同時融合大模型、3D數(shù)據(jù)集、可視算法,構(gòu)建了空間智能MaaS平臺,通過跨類型數(shù)據(jù)的智能解析提高數(shù)據(jù)標(biāo)準(zhǔn)化程度和易用性。
今年10月份,天娛數(shù)科采集加工形成的“人形機(jī)器人空間動捕長程數(shù)據(jù)”“大場景空間感知模型重建數(shù)據(jù)”等5個3D具身智能數(shù)據(jù)集正式在北京國際大數(shù)據(jù)交易所完成數(shù)據(jù)資產(chǎn)登記,通過數(shù)據(jù)信息的核驗(yàn)、合規(guī)審查、登記備案等環(huán)節(jié),成為全國首個完成資產(chǎn)登記的3D具身智能數(shù)據(jù)集。
標(biāo)準(zhǔn)、人才、平臺缺一不可
對于我國人形機(jī)器人產(chǎn)業(yè)未來的發(fā)展,賀晗提出了幾點(diǎn)建議。
“首先要加快標(biāo)準(zhǔn)制定與完善,包括硬件接口標(biāo)準(zhǔn)、軟件通信協(xié)議標(biāo)準(zhǔn)、3D數(shù)據(jù)集標(biāo)準(zhǔn)、性能標(biāo)準(zhǔn)等,確保不同企業(yè)的產(chǎn)品之間能夠?qū)崿F(xiàn)更好的兼容性和互操作性,同時大力推動標(biāo)準(zhǔn)國際化。”
賀晗還專門提到了加強(qiáng)復(fù)合型人才培養(yǎng)。
“目前人形機(jī)器人領(lǐng)域懂機(jī)械、自動化、程序控制的很多,懂大模型、具身智能的很少,兩者都懂的少之又少,建議在高校中設(shè)置具身智能相關(guān)專業(yè)或方向,加強(qiáng)多學(xué)科交叉融合,增加實(shí)踐教學(xué)環(huán)節(jié),培養(yǎng)學(xué)生的跨學(xué)科思維和實(shí)際動手能力?!辟R晗說。
通用平臺建設(shè)也必不可少?!耙挠布杰浖?、從底層到應(yīng)用層、從模型底座到3D數(shù)據(jù)集的多層次具身智能通用平臺架構(gòu),鼓勵企業(yè)、高校和科研機(jī)構(gòu)等各方在平臺上進(jìn)行技術(shù)研發(fā)、應(yīng)用創(chuàng)新和資源共享,形成良好的產(chǎn)業(yè)協(xié)同創(chuàng)新氛圍,降低創(chuàng)業(yè)門檻,避免重復(fù)‘造輪子’,加速具身智能技術(shù)的推廣應(yīng)用和產(chǎn)業(yè)化進(jìn)程。”賀晗說。