本報25日訊(記者程瑤)25日,2025中國計算機大會各項活動在哈爾濱如火如荼地進行,一場主題為“具身智能”的大會論壇廣泛吸引了各界參會者的目光。
當前,具身智能與大模型的深度融合已成為推動機器人技術實現產業落地的核心方向,可以說,大模型時代為具身智能的發展注入了全新動能,推動其從概念構想邁向能與物理世界深度交互的可行實體。在這一背景下,本屆CNCC特設具身智能大會論壇,旨在匯聚頂尖智慧,共探智能體“感知—決策—行動”閉環的實現路徑與核心挑戰,勾勒通向通用人工智能的具身之路。
中國科學院大學教授蔣樹強,哈爾濱工業大學人工智能學院執行院長、教授張偉男,西安交通大學教授薛建儒,北京工業大學信息科學技術學院副院長、教授馬楠,北京大學計算機學院前沿計算研究中心研究員、銀河通用創始人兼CTO王鶴圍繞具身智能話題展開了交流與討論,分別從大模型認知、環境交互、人機共融及產業落地等多維視角,分享了前沿洞察與戰略思考。
論壇伊始,專家們首先從人工智能的發展、具身智能的歷史沿革和應用場景等方面對具身智能的研究對象和科學內涵進行了闡釋。具身智能是在從前只在數字世界中交互的智能基礎上,以不同形態的智能體通過跟物理世界耦合,去理解動態物理世界,使其具備自適應能力與持續學習能力,并可通過跨模態感知與周邊環境實時互動的人工智能系統。
人工智能的安全性和可信性受到社會廣泛關注,作為人工智能的一個特定研究方向,具身智能在這方面又會面臨哪些問題?針對這一議題,專家們認為,具身智能作為一個軟硬件耦合的系統,其安全問題是多層次的復合問題,解決的路徑也應當從計算安全、網絡安全、神經網絡的可信、執行安全等各層面去拆解,或是從當下到未來不同時間點可能面臨的主要安全問題去分析,這也是未來業界需要長期努力的研究方向。從目前的產業實踐來看,搭建一個標準的平臺對安全可信進行分級是一個思路,從自身安全和外延安全兩方面去排除危險因素,實現內外兼修也是一個思路。
對具身智能與大模型之間關系的未來走向議題,專家們結合各自領域實踐進行了頗有建樹性的思辨。語言大模型或者多模態視覺語言動作模型等大模型對具身智能的推動毋庸置疑,但結合自然界中很多生物智能行為的觀察,會發現語言是智能的,但要具備智能不是必須通過語言,這也就意味著VLA是否是具身智能的最終范式仍有探討的空間,要看具體的應用場景,而建立通用的框架和評判標準是學界應該盡快完成的工作。
暢想具身智能未來的發展之路,專家們一致認為,通用具身智能是具身智能行業發展的長遠和核心目標,但囿于硬件和數據等方面的限制,要實現這個目標還有很長一段路要走。而在此之前,適合特定應用場景的專用具身智能的研究路線也應不斷推進。