新榜讯 阿里云旗下视觉生成基座模型万相 2.1(Wan)震撼开源,此次开源遵循最为宽松的 Apache2.0 协议,14B 和 1.3B 两个参数规格的全部推理代码与权重尽数开源,并且支持文生视频及图生视频任务。据了解,14B 万相模型于指令遵循、复杂运动生成、物理建模、文字视频生成等领域表现卓越。1.3B 版本的测试结果不但超越了尺寸更大的开源模型,甚至接近部分闭源模型,同时能够在消费级显卡上运行,仅需 8.2GB 显存便可生成高品质视频,适用于二次模型开发及学术研究。(记者 黄心怡)
扫描二维码
手机浏览
阿里万相视频生成模型开源
分享文章链接
相似推荐

潞晨科技推出视频生成模型Open-Sora 2.0
新榜讯 3 月 13 日,潞晨科技重磅宣布推出 Open-Sora 2.0,并将模型权重、推理代码以及分布式训练全流程全面开源。

阿里巴巴将开源旗下文生视频模型万相2.1
新榜讯 2 月 25 日最新消息,据知情人士透露,阿里巴巴将于今日晚间对旗下视频生成模型万相 2.1 模型进行全面开源。

豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源
新榜讯 由豆包大模型团队携手北京交通大学、中国科学技术大学联合提出的视频生成实验模型“VideoWorld”,有别于 Sora 、DALL-E 、Midjourney 等主流多模态模型,在业界率先达成无需依赖语言模型便能认知世界的突破。