4月10日,靈初智能正式發(fā)布新一代具身大模型Psi-R2與Psi-W0,并宣布開源首批1000小時人類手部操作全模態(tài)數(shù)據(jù)集。該數(shù)據(jù)集總儲備達10萬小時,為當前行業(yè)最大的開源人類手部操作數(shù)據(jù)集,標志著具身智能從實驗室走向產業(yè)化的關鍵一步。

Psi-R2是首個使用10萬小時量級人類數(shù)據(jù)預訓練的World Action Model,輸入圖片和語言即可輸出預測的未來視頻和機器人動作。基于"The Bitter Lesson"理念,模型直接通過運動學將人類關節(jié)與機器人對齊,讓模型從海量數(shù)據(jù)中自主學習。實驗表明,僅需不到100條軌跡的真機數(shù)據(jù)微調,即可完成手機裝配、工業(yè)包裝、疊紙盒等長程精細操作,大幅降低企業(yè)部署成本與落地周期。        Psi-W0作為Action-Conditioned World Model,核心功能是對Policy進行評估與提升,并通過強化學習將人類數(shù)據(jù)的dynamic遷移至機器人dynamic,與Psi-R2形成數(shù)據(jù)飛輪:在Psi-W0中微調生成機器人數(shù)據(jù),篩選高質量數(shù)據(jù)重新加入訓練,實現(xiàn)能力持續(xù)迭代提升,完成從人類經驗到機器人能力的快速轉化。

此次開源的數(shù)據(jù)集具備三大亮點:全模態(tài)覆蓋視覺、語言、關節(jié)角度、觸覺四類信息;通過自研外骨骼手套采集,3D軌跡精度達亞毫米級;涵蓋工業(yè)裝配、生活操作、物體抓取等多場景任務。該數(shù)據(jù)集可廣泛應用于智能制造、物流倉儲、商業(yè)服務等商業(yè)化場景,加速具身智能在千行百業(yè)的落地應用。

目前,靈初智能正與北京石景山區(qū)共建數(shù)采基地,與騰訊云達成深度合作,并攜手覓蜂科技、智域基石等頭部數(shù)據(jù)服務商構建產業(yè)生態(tài)。靈初智能以"數(shù)據(jù)+模型"雙輪驅動,推動具身智能從Demo走向規(guī)模化商用,助力產業(yè)智能化升級。