特朗普稱美國經濟麵臨“轉型期” 對“衰退說”避而不談

【導讀】可利用人類視頻學習,智元發布首個通用具身基座大模型GO-1

中國基金報記者 憶山

3月10日,智元機器人宣布,發布首個通用具身基座大模型——智元啟元大模型(Genie Operator-1,以下簡稱GO-1)。

上周,智元機器人聯合創始人彭誌輝在微博上預告“下周有好東西發布”,引發廣泛關注。3月10日上午,“華為離職天才少年官宣刷屏”話題登上微博熱搜第一,在榜時長超4個小時。

將加速具身智能的普及

據介紹,GO-1開創性地提出了Vision-Language-Latent-Action(ViLLA)架構,該架構由VLM(多模態大模型)+MoE(混合專家模型)組成。

其中,VLM借助海量互聯網圖文數據獲得通用場景感知和語言理解能力,MoE中的Latent Planner(隱式規劃器)借助大量跨本體和人類操作視頻數據獲得通用的動作理解能力,MoE中的Action Expert(動作專家)借助百萬真機數據獲得精細的動作執行能力。三者環環相扣,實現了可以利用人類視頻學習,完成小樣本快速泛化,降低了具身智能門檻,並成功部署到智元多款機器人本體,持續進化,將具身智能推上了一個新台階。

智元機器人表示,通過Vision-Language-Latent-Action(ViLLA)創新性架構,他們在五種不同複雜度任務上測試GO-1,相比已有的最優模型,GO-1成功率大幅領先,平均成功率提高了32%。其中“Pour Water”(倒水)、“Table Bussing”(清理桌麵)和“Restock Beverage”(補充飲料)任務表現尤為突出。此外,他們還單獨驗證了ViLLA架構中Latent Planner的作用,發現增加Latent Planner可以提升12%的成功率。

智元機器人指出,GO-1大模型借助人類和多種機器人數據,讓機器人獲得了革命性的學習能力,可泛化應用到各類環境和物品中,快速適應新任務、學習新技能。同時,它還支持部署到不同的機器人本體,高效地完成落地,並在實際使用中持續不斷地進化。

智元機器人還稱,GO-1大模型將加速具身智能的普及,機器人將從依賴特定任務的工具,向著具備通用智能的自主體發展,在商業、工業、家庭等多領域發揮更大的作用,通向更加通用全能的智能未來。

彭誌輝稱明天還有驚喜

值得注意的是,3月10日,在智元機器人正式發布首個通用具身基座大模型後,彭誌輝在微博上轉發並留言稱:“明天還有驚喜。”

2020年,彭誌輝通過“華為天才少年”計劃加入華為。2022年,他從華為離職,不久後創立機器人品牌智元機器人。

智元機器人成立以來獲得了多輪融資,投資方有高瓴創投、鼎暉投資、高榕資本、BV百度風投、經緯創投、等。2023年8月,公司正式發布遠征A1智能機器人;2024年8月,又發布了五款商用人形機器人新品。目前,智元機器人主要有三條產品線,分別是遠征、Genie和靈犀。

今年1月,智元機器人宣布量產的第1000台通用具身機器人正式下線,其中雙足人形機器人(遠征A2/靈犀X1)有731台,輪式通用機器人(遠征A2-D/A2-W)有269台。

數據開源上,今年2月,智元機器人宣布推出自主研發的大型仿真框架AgiBot Digital World,為機器人操作提供靈活的仿真數據生成方案、預訓練的大規模仿真數據和統一的模型評測標準,同步開源海量仿真數據。

近期,智元機器人通用業務部總裁王闖表示,2025年,智元機器人計劃逐步上線開發者平台,提供機器人開發文檔和工具鏈,同時推出機器人雲服務和開發者社區,進一步降低開發門檻,吸引更多開發者參與具身智能的創新。

此外,A股方麵,繼、、後,今年以來,、等多家上市公司相繼宣布與智元機器人展開合作。

編輯:趙新亮

校對:王玥

製作:小茉

審核:許聞

撫州市
上一篇:做披薩不放芝士可以麽(披薩不放芝士可以嗎)
下一篇:恒實科技:公司參股公司前景無憂的載波模塊目前主要應用於智能電表