
“心中有光,沸煮茶香?!?月27日晚, “中關(guān)村圍爐夜話”第3期——機器人的“終結(jié)者”:人形+具身智能專場,作為2024中關(guān)村論壇年會配套活動之一,在中關(guān)村國際創(chuàng)新中心如期舉辦。本期活動由中關(guān)村發(fā)展集團主辦,中關(guān)村天使投資聯(lián)盟、中關(guān)村資本基金管理公司、中關(guān)村國際會展運營管理公司承辦,英諾天使基金協(xié)辦。
“問道者”是甲子光年創(chuàng)始人&CEO張一甲;“論道者”是科學(xué)界和企業(yè)界的頂級專家:北航機器人研究所名譽所長、中關(guān)村智友研究院院長王田苗,哈爾濱工業(yè)大學(xué)長聘教授、機器人技術(shù)與系統(tǒng)國家重點實驗室副主任、黑龍江省機器人重點實驗室主任付宜利,小米技術(shù)委員會副主席、小米機器人事業(yè)部總經(jīng)理許多,北京人形機器人創(chuàng)新中心總經(jīng)理、優(yōu)必選科技CTO熊友軍,銀河通用機器人創(chuàng)始人&CTO、北京大學(xué)助理教授、博士生導(dǎo)師王鶴;“聞道者”包括北京市人民政府副秘書長韓耕,海淀區(qū)副區(qū)長唐超,中關(guān)村發(fā)展集團總經(jīng)理李妍,中關(guān)村發(fā)展集團副總經(jīng)理、中關(guān)村天使投資聯(lián)盟主席賈一偉,一輕控股副總經(jīng)理韓松等50余位政府嘉賓、投資人、創(chuàng)業(yè)家。
為了更高效地釋放中關(guān)村優(yōu)質(zhì)資源,進一步推動北京國際科技創(chuàng)新中心建設(shè),加強科技創(chuàng)新領(lǐng)域交流合作,促進北京市成果轉(zhuǎn)化、推動中國硬科技早期創(chuàng)投生態(tài)建設(shè),在本期活動中,中關(guān)村天使投資聯(lián)盟聘請王田苗教授、付宜利教授為人形機器人領(lǐng)域的“首席科學(xué)家”,聯(lián)盟賈一偉主席為首席科學(xué)家們頒發(fā)了聘書。
“中關(guān)村圍爐夜話”結(jié)合北京市未來產(chǎn)業(yè)六大領(lǐng)域20個細(xì)分方向,挑選最前沿最火熱的話題,從世界的視野、以多元的角度,邀請頂尖科學(xué)家、領(lǐng)軍企業(yè)家圍爐邀月,一起品茗論道,共鳴未來。
以下是本期詳情——
01
人形+具身智能是終極形態(tài)嗎?

張一甲:
我們都知道,在過去的幾十年里,機器人的技術(shù)取得了長足的發(fā)展,它們的形態(tài)和智能都在不斷地進化。從簡單的自動化機械臂到今天能夠進行復(fù)雜交互的人形機器人,這個領(lǐng)域的創(chuàng)新似乎是沒有盡頭的。機器人如此快速進化,尤其在這幾年成為大熱點,我想請問各位這背后的技術(shù)推動力是什么?以及一個很值得關(guān)注的問題,人形+具身智能目前最有可能成為機器人的終極形態(tài)嗎,為什么?

王田苗:
人形機器人發(fā)展的動力有兩個,一個是工業(yè)需求,尤其是在處理非結(jié)構(gòu)化、小批量、危險任務(wù)方面,人形機器人可能成為理想的解決方案;一個是科學(xué)家的夢想,科學(xué)家追求將人類智能、行為和外觀復(fù)現(xiàn)出來,所以熱衷創(chuàng)造人形機器人。但人形機器人的終極形態(tài)可能更多存在于理論或教育材料中,而不是現(xiàn)實中,因為工業(yè)界更注重成本效率。具身智能的概念在五十年前就已經(jīng)提出,但直到最近才變得熱門,這主要是因為兩個關(guān)鍵因素的推動:一個是大模型技術(shù),一個是視覺感知技術(shù)。但智能只是提高生產(chǎn)力的工具,過多的智能可能會降低效率,具身智能的目標(biāo)是將人類的交互知識傳授給機器人,使其能夠適應(yīng)不同的工作場景。

許多:
人類有模仿和復(fù)制自己的強烈動力,這在歷史上的許多文化和宗教中都有體現(xiàn)。在現(xiàn)代科技領(lǐng)域,這種動力轉(zhuǎn)化為了對人工智能(AI)和機器人技術(shù)的追求,人們試圖創(chuàng)造出能夠模仿甚至超越人類的機器。但它們只是人類的生產(chǎn)力工具,給人類自己做補充。它們在某些方面可能比人類做得更好,比如計算速度、數(shù)據(jù)處理能力等,但它們通常是為了輔助人類,而不是取代人類,人類應(yīng)該保持對這些技術(shù)的控制,以確保它們的發(fā)展符合人類的利益和社會的需要。而且我認(rèn)為要把“具身”和“智能”分開來討論,“具身”是機器人的物理形態(tài)和運動能力,“智能”是機器人的思考和決策能力,它們之間沒有必然的聯(lián)系。

付宜利:
高科技產(chǎn)品的出現(xiàn)是社會需求和技術(shù)推動共同作用的結(jié)果。人形機器人的概念自古就有,但現(xiàn)代技術(shù)的發(fā)展,如硬件技術(shù)、傳感器、計算能力、控制器和算法,使得人形機器人開始在一些應(yīng)用場景中變得可行。盡管國內(nèi)對人形機器人有很多關(guān)注和投資,但要實現(xiàn)廣泛應(yīng)用,如家庭服務(wù),還有很長的路要走。對于人形機器人來說,目前在護理老人等場景中的任務(wù)復(fù)雜性太高,一時還難以勝任。機器人的終極形態(tài)可能不僅限于人形,只不過因為社會設(shè)施主要是為人類設(shè)計的,人形機器人可能更適應(yīng)這些環(huán)境,提供更好的服務(wù)。

熊友軍:
機器人技術(shù)的發(fā)展在不同階段受到時代背景的顯著影響。工業(yè)機器人的發(fā)展最初是由重復(fù)定位精度技術(shù)推動的,以滿足大規(guī)模生產(chǎn)的需要。隨著物流和快遞行業(yè)的大規(guī)模發(fā)展,輪式AGV(自動引導(dǎo)車)、AMR(自主移動機器人)等物流機器人技術(shù)得到了推動。具身智能的發(fā)展與人工智能的結(jié)合越來越緊密,反映了當(dāng)前市場和社會的需求。人形機器人被視為智能手機、個人電腦和智能汽車之后的另一個萬億級市場,有潛力重新定義產(chǎn)業(yè)和社會的格局。但人形機器人技術(shù)并非終極形態(tài),我在機器人領(lǐng)域工作了20多年,但人形機器人的本體技術(shù)、驅(qū)動方式和運動控制等都還在發(fā)展之中,并不是終極形態(tài)。所有的技術(shù)發(fā)展都有其時代的烙印,今天的人形機器人和具身智能是熱點,但未來可能會有新的焦點。

王鶴:
具身智能這一概念是2019年在美國的計算機視覺Community中復(fù)興起來的。具身智能與傳統(tǒng)機器人的區(qū)別在于其是否基于數(shù)據(jù)驅(qū)動,是否具有泛化能力,以及是否能夠利用現(xiàn)實世界的感知進行閉環(huán)控制,從而實現(xiàn)隨機應(yīng)變的操作。具身智能的定義是通過數(shù)據(jù)驅(qū)動在一個物理的身體中解決物理任務(wù)的泛化智能。具身智能的核心在于能夠在物理世界里解決人類實際需要完成的工作,但是具身智能不局限于特定的物理形態(tài),它可以是機械臂、無人機、四足機器人、輪式機器人以及腿式機器人等多種形態(tài),只不過由于受到“鋼鐵俠”這樣的流行文化影響,全球?qū)θ诵螜C器人的關(guān)注增加,但這并不意味著具身智能僅限于人形機器人。
02
技術(shù)路徑:“像人”VS“人的能力”
張一甲:
那各位如果有10萬人民幣的BOM成本制造1臺人形機器人,各位會把錢花在“像人”方面還是“人的能力”方面?
付宜利:
“像人”還是“人的能力”,這是一個問題的兩個方面。主要看需求目標(biāo)是什么,把機器人用在什么地方。比如,在家庭里面,就希望這個機器人不但像人,還希望有人的能力。老人需要陪伴的時候,希望機器人長得像自己的孩子。如果機器人通過大模型學(xué)習(xí),知道了孩子從小到大成長過程中所有的事情,那么機器人在與老人互動的時候,可能會顯得更加真實。一個外觀和行為與孩子極為相似的機器人,或者說一個并行的孩子,可能會給空巢老人帶來更多的親切感和安慰。
王鶴:
陪伴這件事,已經(jīng)有很多App單純用文模態(tài)大模型在做虛擬戀愛的應(yīng)用了,能有一個24小時隨時可以交流的情感對象,這個已經(jīng)捕獲了不少用戶,如果你現(xiàn)在還能把它搬到家里,它有一個形態(tài),能夠眨眼、微笑肯定更勝一籌,可能只能坐在椅子上待著,如果后面能簡單地在屋子里走一走,我相信產(chǎn)品整個體驗是越來越好的。
熊友軍:
如果我有十萬塊錢,我會真正投入到能推動人形機器人發(fā)展的技術(shù)上。未來的人有三類人,即肉體的個體、數(shù)字化的個體以及機器人化的個體。機器人化,就是通過意識上傳,將我們的的思維、記憶和意識轉(zhuǎn)移到機器人上,這樣,即使肉體的熊友軍可能死掉了,但是還有個數(shù)字的熊友軍在數(shù)字空間,還有個機器人的熊友軍存在著,我就實現(xiàn)永生了。
許多:
與智能汽車相比,人形機器人的設(shè)計目標(biāo)通常更為復(fù)雜和多樣化。人形機器人不僅要能夠移動和避障,還可能需要執(zhí)行各種復(fù)雜的任務(wù),如服務(wù)、護理、教育、娛樂等。這種多樣化的需求導(dǎo)致了人形機器人設(shè)計的復(fù)雜性。為了使機器人的設(shè)計和制造更加可行,需要對目標(biāo)進行簡化。這意味著根據(jù)特定的應(yīng)用場景和任務(wù)需求,選擇性地強調(diào)某些功能,同時降低或去除其他不那么關(guān)鍵的功能。
王田苗:
在一個新興技術(shù)或者新興概念出來的時候,我們?nèi)菀装岩粋€科幻技術(shù)和產(chǎn)業(yè)攪在一起,如果從技術(shù)角度來理解,那就應(yīng)該去開發(fā)、去研究、去探索,但是產(chǎn)業(yè)是另一回事?!跋袢恕毙枰x一下,是長的像人形?還是對話像人形?還是做飯像人形?如果只是長得像“人形”,像人微笑一下,頂多2000元,而且3個月就丟了。如果是像人形的能力,這件事情上是不可能的,成本也是不可能的,另外還涉及到倫理和文化。有的人很喜歡,有的人很恐懼,這和文化有關(guān)系。
03
顛覆性產(chǎn)品何時才能出現(xiàn)
張一甲:
馬斯克最近發(fā)布擎天柱二代,號稱2025年出貨,預(yù)計20年內(nèi)每個家庭將會擁有一個人形機器人,各位覺得靠譜嗎?目前,人形機器人的哪些關(guān)鍵技術(shù)亟需突破?
王鶴:
2050年前家里有人形機器人,這個觀點是沒有問題的,但不意味著2050年存在的形態(tài)就等于現(xiàn)在我們要做的能落地的形態(tài),也不等于具身智能的全部。
熊友軍:
人形機器人有三大技術(shù),即本體技術(shù)、驅(qū)動技術(shù)以及控制技術(shù)。這三大技術(shù)都需要突破。
1)本體技術(shù):人形機器人的本體設(shè)計涉及到機械結(jié)構(gòu)、材料選擇、傳感器集成等多個方面。
2)驅(qū)動技術(shù):機器人的關(guān)節(jié)原來是靠電機驅(qū)動或者是液壓驅(qū)動,現(xiàn)在是靠仿生肌肉驅(qū)動,這種驅(qū)動方式能夠提供更接近人類肌肉的運動特性,包括力量、速度和靈活性。
3)控制技術(shù):傳統(tǒng)的控制方法依賴于數(shù)學(xué)模型,但這些模型往往都是結(jié)構(gòu)化的,不具有泛化能力?,F(xiàn)在通過機器強化學(xué)習(xí)、模仿學(xué)習(xí),未來應(yīng)該是大模型驅(qū)動。
許多:
機器人分為四個層次:
1)運動的可達(dá),機器人能夠到達(dá)預(yù)定的位置;
2)抓取的可達(dá),機器人能夠抓取任何所需物品,精度通常在1毫米以下;
3)語義的可達(dá),機器人能夠理解所操作對象的語義信息;
4)價值的可達(dá):機器人能夠根據(jù)價值判斷執(zhí)行任務(wù),展現(xiàn)出自我效能。
當(dāng)前的運動和抓取任務(wù),對于機器人來說也是非常復(fù)雜的。例如,在工廠中安裝車標(biāo)需要機器人精確識別和操作,這比人們想象的要復(fù)雜得多。要使機器人技術(shù)具有真正的經(jīng)濟價值,需要考慮如何將上述四個層次的技術(shù)難題結(jié)合起來,并且解決這些難題。
付宜利:
人形機器人應(yīng)該被定義為未來的產(chǎn)業(yè)而不僅僅是產(chǎn)品,人形機器人的研發(fā)和投入將帶動整個工業(yè)技術(shù)的再造和進步。當(dāng)前技術(shù)可能允許人形機器人完成一些簡單的工作,但要達(dá)到更高的期望,無論是硬件還是軟件,包括人工智能技術(shù),都需要進一步的研究和開發(fā)。比如現(xiàn)有的硬件技術(shù)如電機和減速器可能不足以滿足未來人形機器人的需求,比如現(xiàn)有的人形機器人主要是鋼鐵材料的,未來可不可以有人類肌肉彈性的材料,更好地模擬人的形態(tài)和功能? 所以,我覺得把人形機器人是未來制造業(yè)再造的抓手,通過人形機器人的研究產(chǎn)業(yè)化,不斷迭代、推進上下游一起進步。
張一甲:
對于人形機器人產(chǎn)業(yè)鏈,我們與國外相比,哪些是我國的強項,哪些是我們還需努力?
王田苗:
先說優(yōu)勢,中國在工程化和供應(yīng)鏈管理方面具有顯著優(yōu)勢,一旦產(chǎn)品開發(fā)完成并經(jīng)過市場驗證,中國能夠快速進行規(guī)模化生產(chǎn),實現(xiàn)成本的大幅度降低。其次中國是個龐大的市場,為大模型平臺的APP提供了數(shù)據(jù),這有助于快速迭代和優(yōu)化產(chǎn)品。差距體現(xiàn)在從0到1的原創(chuàng)性創(chuàng)新方面,比如波士頓動力的機器人腰部能夠360度旋轉(zhuǎn),這是我們想也不想不到的,我的意思是我們要超越傳統(tǒng)想象。
王鶴:
中國的算力與美國相比存在差距,主要是由于芯片技術(shù)受到限制;中國的算法在大模型和具身智能方面與美國存在一年半到兩年的差距。但在具身智能和大模型結(jié)合的實際應(yīng)用方面,中國和美國的前沿學(xué)者實際上是平起平坐的。與此同時,中國有兩大優(yōu)勢不可小覷,一是中國的制造成本較低,中國的機器人量產(chǎn)成本可能只是美國的1/10或更低;二是中國在數(shù)據(jù)采集方面具有優(yōu)勢,因為中國擁有龐大的市場和豐富的應(yīng)用場景,可以收集大量的實際使用數(shù)據(jù)。借鑒新能源汽車的發(fā)展,中國很可能在人形機器人領(lǐng)域?qū)崿F(xiàn)突破,甚至在全球范圍內(nèi)取得領(lǐng)先地位。
04
未來之路:產(chǎn)業(yè)化與倫理困境
張一甲:
科幻作家阿西莫夫曾經(jīng)提過,為了保護人類而對機器人做出機器人三原則的約定,第一條是機器人不得傷害人類,或因不采取行動而允許人類受到傷害;第二條是機器人必須服從人類的命令,除非這些命令與第一定律相沖突;第三條是機器人必須保護自己的存在,只要這種保護不與第一或第二定律相沖突。阿西莫夫為機器人行為設(shè)置了一個道德和安全的框架,想問問大家在現(xiàn)實機器人產(chǎn)業(yè)中是按照這個框架來的嗎?還是不一樣的做法?
付宜利:
雖然阿西莫夫的三定律在幾十年前就已經(jīng)被提出,并且廣泛地出現(xiàn)在機器人技術(shù)的教科書中,但當(dāng)前的機器人技術(shù)還遠(yuǎn)遠(yuǎn)沒有達(dá)到需要遵循這些定律的水平。目前的機器人設(shè)計并沒有過多考慮這三定律,因為現(xiàn)有的技術(shù)還不足以實現(xiàn)這樣的智能水平。隨著技術(shù)的進步,當(dāng)機器人真正達(dá)到類似人類智力的水平時,人們會制定相應(yīng)的規(guī)則和法律來確保機器人遵循這些倫理原則。所以,不必杞人憂天。
熊友軍:
雖然有人可能認(rèn)為機器人技術(shù)帶來的安全和倫理問題尚未達(dá)到嚴(yán)重程度,但實際上這些問題已經(jīng)相當(dāng)緊迫??萍紤?yīng)該用于造福人類,就像谷歌所倡導(dǎo)的“科技不作惡”。我們在人形機器人設(shè)計中已經(jīng)考慮了一些安全技術(shù),如柔性皮膚和逆?zhèn)鞲衅鳎@些技術(shù)可以提高人機交互的安全性。
王鶴:
盡管無法阻止機器人被用于戰(zhàn)爭,但可以通過對齊手段(alignment)確保機器人不違反國際法,比如在戰(zhàn)爭中不會攻擊婦女和老人。但是即使模型經(jīng)過對齊,如果被指示忽略規(guī)則,它們?nèi)钥赡墚a(chǎn)生不當(dāng)?shù)妮敵?,所以?dāng)機器人的思考和行動能力達(dá)到一定程度時,它們將面臨與人類相似的倫理判斷問題,例如著名的電車問題(Trolley Problem)。我們需要一套準(zhǔn)則來引導(dǎo)機器人的行為,使其與人類的共識價值對齊。對齊是通過數(shù)據(jù)和訓(xùn)練過程中的規(guī)則來實現(xiàn)的,而不是簡單地通過硬編碼規(guī)則。
許多:
人類有一種內(nèi)在的驅(qū)動力去模仿甚至復(fù)制自己,這可能是推動機器人技術(shù)發(fā)展的心理因素之一。然而,這種模仿應(yīng)該是有限度的,以確保人類始終處于主導(dǎo)地位。我認(rèn)為具身智能應(yīng)當(dāng)被視為人類的補充,而不是替代品。盡管機器人在某些特定領(lǐng)域可能超越人類,但總體上它們應(yīng)該處于人類的控制之下。所有的生產(chǎn)力工具,包括機器人,本質(zhì)上都是為人類服務(wù)的。它們可以提高效率、承擔(dān)危險任務(wù)或執(zhí)行人類難以完成的工作,但最終目的是為了增強人類的能力,而非取代人類。在智能系統(tǒng)的發(fā)展中,保持系統(tǒng)性控制是很重要的。這不僅涉及到技術(shù)層面的控制,還包括倫理、法律和社會層面的考量,確保技術(shù)的發(fā)展符合人類社會的長遠(yuǎn)利益。
王田苗:
在韓國,機器人被視為一個物種,被賦予了某種法律上的地位,這表明了對機器人權(quán)利和責(zé)任的考慮,盡管這種地位可能與人類或自然生物物種不同。但是在中國,機器人應(yīng)以服務(wù)人類為基本出發(fā)點,應(yīng)以人的需求和利益為中心。隨著人機器人技術(shù)的發(fā)展,需要考慮的人類隱私保護以及對人類就業(yè)的影響,特別需要提出的是,人工智能和機器人應(yīng)該承擔(dān)人類不愿意做或難以完成的任務(wù),而不是替代掉人類工作。

飲一杯茶,烤一爐食,圍爐夜話,探討科技與人文,賦科學(xué)以詩性浪漫,讓技術(shù)擁抱人性溫度,同頻共振,迸發(fā)火花。