新榜讯 近日,香港大学携手字节跳动共同推出基于 Rectified Flow Transformer 架构的视频生成模型 Goku。据悉,此模型具备文本生成视频、图像生成视频等多项任务能力,且在 VBench(84.85)、GenEval(0.76)、DPG-Bench(83.65)等基准测试中成绩出色。另外,官方针对广告场景优化了子模型 Goku+,称其能以低于原成本 100 倍的优势创建广告视频。目前,模型技术报告已公布,不过暂未开放使用。项目地址:https://github.com/Saiyan-World/goku
扫描二维码
手机浏览
字节联合港大发布全新视频模型Goku
分享文章链接
相似推荐

字节跳动发布图像编辑模型SeedEdit 3.0
新榜讯 6月6日,字节跳动Seed团队官宣正式发布图像编辑模型SeedEdit 3.0。

字节豆包大模型团队提出稀疏模型架构UltraMem
新榜讯 2 月 12 日消息,据字节跳动豆包大模型团队透露,其 Foundation 团队于近期推出 UltraMem,这是一种能将计算和参数解耦的稀疏模型架构,在确保模型效果的基础上成功化解了推理的访存难题。

字节跳动将上线全新多模态视频生成模型
新榜讯 字节跳动旗下的一站式 AI 创作平台即梦 AI 即将推出多模态视频生成模型 OmniHuman,仅凭借一张图片和一段音频就能生成一条 AI 视频,此模型系字节自研的闭源模型。