新榜讯 近日,香港大学携手字节跳动共同推出基于 Rectified Flow Transformer 架构的视频生成模型 Goku。据悉,此模型具备文本生成视频、图像生成视频等多项任务能力,且在 VBench(84.85)、GenEval(0.76)、DPG-Bench(83.65)等基准测试中成绩出色。另外,官方针对广告场景优化了子模型 Goku+,称其能以低于原成本 100 倍的优势创建广告视频。目前,模型技术报告已公布,不过暂未开放使用。项目地址:https://github.com/Saiyan-World/goku
扫描二维码
手机浏览
字节联合港大发布全新视频模型Goku
分享文章链接
相似推荐

字节跳动将上线全新多模态视频生成模型
新榜讯 字节跳动旗下的一站式 AI 创作平台即梦 AI 即将推出多模态视频生成模型 OmniHuman,仅凭借一张图片和一段音频就能生成一条 AI 视频,此模型系字节自研的闭源模型。

Adobe发布视频音效生成模型MultiFoley
新榜讯 近日,Adobe 重磅推出专为视频配音的模型 MultiFoley,其支持经由文本、音频以及视频进行多模态生成。

字节跳动豆包大模型下周将发布视频生成模型
新榜讯 9 月 19 日消息,字节跳动宣称将于 2024 年 9 月 24 日推出豆包大模型的视频生成模型,且会在当日于深圳举行的火山引擎 AI 创新巡展·深圳站大会上予以公布。