鳳凰網科技訊 2月26日,25日深夜阿裏雲視頻生成大模型萬相2.1(Wan)正式宣布開源,此次開源采用Apache2.0協議,14B和1.3B兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務。
據阿裏雲官方介紹,14B版本萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方麵表現突出,在權威評測集Vbench中,萬相2.1以總分86.22%大幅超越Sora、Luma、Pika等國內外模型,穩居榜首位置。
1.3B版本萬相模型不僅超過了更大尺寸的開源模型,甚至還和一些閉源的模型結果接近,同時能在消費級顯卡運行,僅需8.2GB顯存就可以生成480P視頻,適用於二次模型開發和學術研究。
隨著萬相的開源,阿裏雲兩大基模全部開源,實現了全模態、全尺寸大模型的開源。
萬相大模型在多個內部和外部基準測試中,均大幅超越現有的開源模型以及頂尖商業閉源模型。萬相能夠穩定展現各種複雜的人物肢體運動,如旋轉、跳躍、轉身、翻滾等;能夠精準還原碰撞、反彈、切割等複雜真實物理場景。
在指令遵循能力方麵,能夠準確理解中英文長文本指令,還原各種場景切換、角色互動。

探討中德企業合作 服務惠州經濟建設
上一篇2025-07-05 14:53:40
產經:從限售到調整拿地政策 蘇州房地產調控加碼
下一篇2025-07-05 14:53:40
相关文章
发表评论
评论列表