11月12日,蓋世汽車獲悉,中國電子技術標準化研究院發布“求索”具身智能測評基準EIBench并開展首次測評(基于在編國標)。
據悉,“求索”具身智能測評基準EIBench,是針對具身智能數據難復用、模型泛化性差、安全難保障等產業痛點推出的首個具身智能領域評測基準,聚焦數據格式、具身智能大模型、安全及可信賴度等,形成基于國家標準的測評指標體系。該標準在模型側主要面向VLA和VLM兩類具身智能大模型,這也代表著我國具身智能行業發展在規范化和標準化的方向上邁出了關鍵一步。
本次測評中,北京人形機器人創新中心的XR-1模型成為唯一通過測試的VLA(視覺-語言-動作)模型,獲頒CESI-CTC-20251103具身智能測試證書。此次成果標志著我國具身智能技術邁向標準化驗證新階段。

圖片來源: 北京人形機器人創新中心
在測試中,XR-1共在天工2.0、UR、Franka等三款機器人上,針對取放、推拉、旋轉、插入等雙臂技能進行基礎測試,以及物體顏色、位置、姿態,環境亮度、色溫,背景、干擾物等七大維度的泛化測試,一致通過。每項測試定量采集40-50條少量數據,在每個任務每項測試維度進行10次以上的真機測試,測試全程由中國電子技術標準化研究院專家參與,在流程設計和實際執行層面均做到了標準化公平可復現。