智元機器人發佈首個通用具身基座模型-科技-極速新聞-每日看看

智元機器人發佈首個通用具身基座模型

2025-03-10 14:57 由環球網發佈於科技 512

【環球網科技綜合報道】3月10日消息，智元機器人今天正式發佈首個通用具身基座模型——智元啓元大模型（Genie Operator-1），開創性提出Vision-Language-Latent-Action (ViLLA) 架構。

據悉，該架構由VLM(多模態大模型) + MoE(混合專家)組成，其中VLM藉助海量互聯網圖文數據獲得通用場景感知和語言理解能力，MoE中的Latent Planner(隱式規劃器)藉助大量跨本體和人類操作視頻數據獲得通用的動作理解能力，MoE中的Action Expert(動作專家)藉助百萬真機數據獲得精細的動作執行能力。

智元機器人方面表示，這三者環環相扣，實現了可以利用人類視頻學習，完成小樣本快速泛化，降低了具身智能門檻，併成功部署到智元多款機器人本體，持續進化，將具身智能推上了一個新臺階。

智元機器人方面稱，GO-1大模型將加速具身智能的普及，機器人將從依賴特定任務的工具，向着具備通用智能的自主體發展，在商業、工業、家庭等多領域發揮更大的作用，通向更加通用全能的智能未來。（思瀚）