2025年3月29日,2025年中關村論壇年會人工智能主題日專場論壇、2025“智領未來”北京人工智能系列活動“通用人工智能論壇”在北京中關村國際創(chuàng)新中心召開。
近年來,北京市為加快打造人工智能創(chuàng)新發(fā)展高地,促進人工智能加速賦能千行百業(yè),發(fā)布了《北京市推動“人工智能+”行動計劃(2024-2025年)》。為積極落實北京市人工智能產(chǎn)業(yè)發(fā)展戰(zhàn)略布局,北京通用人工智能研究院(簡稱“通研院”)在北京市科委、中關村管委會的支持下,依托自身人才資源和科技研發(fā)能力,結合市場需求,在會上重磅發(fā)布了覆蓋通用智能體+行業(yè)智能體+社會智能體三大智能體矩陣。其成果以“原創(chuàng)技術-產(chǎn)業(yè)賦能-社會智能”三級聯(lián)動模式,推動人工智能從單一智能向社會智能轉(zhuǎn)變。

原始創(chuàng)新驅(qū)動智能突破:
通用、行業(yè)、社會三大智能體矩陣集中發(fā)布

(一)全球首個通用智能人“通通”2.0升級迭代
“通通”2.0在大會上重磅發(fā)布。相較于通通1.0版本,“通通”2.0在語言、認知、動作、學習、情緒、交互方面實現(xiàn)了多種核心能力的升級:
一是價值與心智驅(qū)動的多輪對話。當前,國內(nèi)外諸多大語言模型通過指令微調(diào)和強化學習下的人機價值對齊等技術手段,雖然能夠較好地完成人機多輪對話任務,但此類對話更多的是圍繞用戶的需求及觀點進行,本質(zhì)上缺乏自身相對連貫的價值觀、世界觀以及據(jù)此演繹出來的對話內(nèi)容?!巴ㄍā?.0版本實現(xiàn)了一個有自身價值觀、世界觀的小女孩,在理解對話目標意圖的基礎上,遵循自身價值和人格,利用對話策略來引導對話的走向,從而達到自身的目的。
二是基于交互反饋的推理和學習?!巴ㄍā鄙钤诟叨确抡娴膹碗s、動態(tài)三維虛擬場景中,1.0版本的“通通”在任務執(zhí)行過程中,如果周圍環(huán)境時刻在發(fā)生變化,會導致她原本規(guī)劃的任務無法順利完成。但“通通”2.0可以實時響應外界場景的變化,進行反思和重新規(guī)劃,對已有任務進行掛起、恢復、修改或取消等處理,同時動態(tài)生成新的任務規(guī)劃,從而以更靈活、智能、多變的方式完成指令。不僅如此,不同于當前大語言模型普遍采用的離線數(shù)據(jù)驅(qū)動的學習模式,“通通”在和場景交互(自主學)及與人類的多模態(tài)對話(他人教)過程中,能動態(tài)更新自身的知識庫,價值函數(shù)和技能,使得它初步具備類人的持續(xù)反思和成長的能力。
三是多智能體交互。研究人員為“通通”打造了幼兒園、六口之家等多智能體場景,并在場景中設置了各自獨立、具備自身價值、能力、人設、狀態(tài)的多個智能體,在這種多智能體場景中,“通通”不僅需要理解周圍環(huán)境,還需要理解環(huán)境中其他智能體,識別他們的身份、性格和自身的關系、彼此之間的關系和物品的關系、當前動作、意圖、氣氛等,并在此基礎之上進行自身的任務規(guī)劃,包括發(fā)起和響應對話,實施幫助、搗亂等復雜行為交互。
(二)全球通用人工智能數(shù)理定義、評級標準與測試平臺通智測試(TongTest)發(fā)布
為了測試通用智能體的能力,通研院自主設計開發(fā)的通智測試(TongTest)是一個專為評估通用人工智能(AGI)而設計的綜合評測體系,該體系包含一個六維度(視覺、語言、認知、運動、學習、價值)、五層級(初級自身價值、高級自身價值、多智能體互動的價值、基礎社交價值、高級社交價值)的智能體評級標準,以及一個支撐該評級標準實現(xiàn)的智能體虛擬測試平臺。通智測試基于“論績、論跡、論理、論心”四論標準,即以結果為核心的基礎評價、關注行為過程與軌跡、聚焦推理路徑的合理性、探究動機與價值觀的正確性,實現(xiàn)了“通用能力測試-專項能力測試-行業(yè)應用測試”三位一體。
TongTest突破了傳統(tǒng)人工智能測試方法的局限,填補了通用人工智能評測的國際空白,為規(guī)范通用人工智能的發(fā)展提供了科學的度量與指揮棒,為人工智能的安全與標準提供了數(shù)理框架,同時也為我國在通用人工智能領域搶占國際話語權提供了科學依據(jù)。
經(jīng)過TongTest 86項綜合任務(比如收拾房間、整理餐桌等)對“通通”進行的階段性測試結果顯示,與人類兒童發(fā)展階段對比,“通通”主要能力維度已初步達到5-6歲發(fā)展水平,相當于幼兒園小朋友的水平。
(三)通通到我家——三維場景重建與具身智能數(shù)據(jù)構建平臺發(fā)布
為了提升和訓練通用智能體的能力,大會發(fā)布三維場景重建與具身智能數(shù)據(jù)構建平臺“通通到我家”,該平臺能“把現(xiàn)實世界搬進電腦”,讓智能體“通通”走進千家萬戶。也就是說,無論是家庭客廳、商場街道,還是復雜工業(yè)環(huán)境,“通通到我家”都能進行任意圖片或視頻的三維重建,快速構建高精度、可交互的三維虛擬空間,精準還原真實世界的物理細節(jié),并自動標注場景中物體的屬性與空間關系,形成百萬級語義數(shù)據(jù)集,為機器人、數(shù)字人、智能人在虛擬場景中進行學習、社交、訓練提供強大的數(shù)據(jù)支撐和技術保障。同時該成果突破傳統(tǒng)學習的限制,讓智能體在虛擬空間和真實環(huán)境中無縫切換,推動更多智能、可靠的智能體走進千家萬戶,未來將引領數(shù)字孿生、家庭服務機器人、元宇宙等領域邁入全新發(fā)展階段。
(四)通用人工智能行業(yè)智能體工場(TongAgents)發(fā)布
如果想讓智能體大規(guī)模開發(fā)和應用,則必須有一套標準的孵化工具和平臺。通用人工智能行業(yè)智能體工場TongAgents,是助力行業(yè)AI Agent快速孵化的高效工具與平臺,就像一個智能體的“制造工廠”。平臺提供了一整套智能體全生命周期的標準化工具鏈,覆蓋智能體的設計、訓練、調(diào)試到最后的實際部署全流程。
平臺提供便捷的SDK及圖形化低代碼界面,支持多種形態(tài)智能體的構建與發(fā)布,大幅降低使用門檻,滿足不同研發(fā)能力和背景的開發(fā)者及企業(yè)的智能體構建需求。同時,TongAgents擁有豐富的數(shù)字形象庫,可迅速打造無形象、虛擬數(shù)字人、具身機器人等多樣化的Agent,滿足不同行業(yè)需求,能有效實現(xiàn)通用人工智能在各個行業(yè)落地生根。
TongAgents的推理架構除對接了主流大模型之外,還融合通院自研的CUV架構,實現(xiàn)推理過程可解釋、可溯源。同時除目前常見的非具身形態(tài)的智能體之外,TongAgents也支持定義和驅(qū)動虛擬數(shù)字人和具身機器人形態(tài)的智能體,拓展了AI Agent的應用邊界。
(五)從“小女孩”到“大社會”大型社會模擬器促進中國式現(xiàn)代化
北京通用人工智能研究院多智能體實驗室負責人陳爍介紹了社會級智能體,并現(xiàn)場演示了大型社會模擬器(Large Social Simulator)。據(jù)介紹,人工智能技術正加速從單體智能向群體智能和社會級智能演進。在這一趨勢下,社會級智能體的研究正成為人工智能領域的前沿方向。由北京大學武漢人工智能研究院和通研院共同研發(fā)的大型社會模擬器就是一個社會級智能體學習和實踐的仿真模擬平臺。
模擬器借助分布式計算、高并發(fā)調(diào)度技術,在高度擬真的3D仿真環(huán)境中模擬個體智能體與社會級智能體的交互和演化過程。它通過多維度數(shù)據(jù)融合與動態(tài)交互建模,構建了一個包含上百萬人的虛擬社會系統(tǒng),利用多智能體價值觀建模和數(shù)字孿生技術精準推演社會運行規(guī)律,模擬不同社會決策的長遠影響,提供前瞻性決策支持。同時,大型社會模擬器對于社會發(fā)展的動態(tài)推演,還能為社會學研究提供強大支撐,解決文科無法做實驗的問題。
目前,大型社會模擬器已經(jīng)在武漢東湖高新區(qū)國家智能社會治理實驗綜合基地發(fā)布V1.0版本。為提供高度擬真的城市仿真空間,武漢團隊已完成518平方公里的L1至L5級數(shù)據(jù)建模,并支持全場景實時天氣與光照的動態(tài)仿真。為了精準對個體級智能體和社會級智能體進行建模,團隊采集了大量脫敏的社會運行數(shù)據(jù),匯聚人口、企業(yè)、經(jīng)濟發(fā)展、交通運行和基礎服務設施等5大主題,囊括企業(yè)特征、人口結構、消費行為、社會經(jīng)濟狀況等10余類核心領域以及170余項指標?;谶@些數(shù)據(jù),大型社會模擬器V1.0全面建模了個體、組織、市場、政府、交通、公共資源這六大社會要素及其交互演化。
通智大腦聯(lián)盟成立:
“大腦”與“身體”協(xié)同研發(fā),賦能生活與產(chǎn)業(yè)服務升級
在北京市科委、中關村管委會的支持下,通研院積極鏈接具身機器人行業(yè)伙伴,將“通通”的技術優(yōu)勢,即人形機器人的“大腦”賦能到機器人本體上。聯(lián)合樂聚、宇樹等多家人形機器人公司共同發(fā)起成立“通智大腦聯(lián)盟”。該聯(lián)盟通過打破技術壁壘,聚焦垂域場景的通智大腦和具身本體協(xié)同研發(fā)及應用,將實現(xiàn)在物理空間上具身智能體從感知到?jīng)Q策、從學習到執(zhí)行的閉環(huán),加速核心技術突破與成果轉(zhuǎn)化。

聯(lián)盟致力于構建首個能從多模態(tài)人——機器人交互數(shù)據(jù)中在線學習豐富具身技能的智能體,技能涵蓋具身推理、常識學習、偏好學習、導航操作學習等。相關技術作為“具身大腦”,可與通用機器人產(chǎn)業(yè)對接,為機器人提供更智能、更靈活的決策支持。擬建設機器人數(shù)據(jù)采集工廠,并將企業(yè)研發(fā)中積累的建設經(jīng)驗、機器人集群運維經(jīng)驗及管理平臺等相關技術,整合為技術服務,提供給制造業(yè)、服務業(yè)等多個行業(yè)。
北京人工智能安全治理協(xié)同創(chuàng)新矩陣發(fā)布:
引領人工智能安全與治理新趨勢
“北京人工智能安全治理協(xié)同創(chuàng)新矩陣”以北京市科委、中關村管委會組織設立的6家北京市重點實驗室為關鍵節(jié)點,鏈接國家級科研機構、頂尖高校、新型研發(fā)機構與行業(yè)領軍企業(yè)的創(chuàng)新資源,共織生態(tài)網(wǎng)絡、共享創(chuàng)新勢能,構建系統(tǒng)化的安全與治理體系。

協(xié)同創(chuàng)新矩陣未來將是集聚培養(yǎng)使用優(yōu)秀創(chuàng)新人才、開展高水平科研活動的重要科技創(chuàng)新基地,通過矩陣互聯(lián)、節(jié)點共振、資源互通、能力互嵌,持續(xù)激發(fā)創(chuàng)新涌現(xiàn),為人工智能的創(chuàng)新和應用提供堅實的安全保障,引領人工智能安全與治理的新趨勢。
來源:中國日報網(wǎng)