登录/注册
扫描二维码
手机浏览

字节跳动推出视频生成模型OmniHuman-1.5

新榜商桥
情报行业动态

新榜讯 近日,字节跳动重磅推出视频生成模型OmniHuman - 1.5。据悉,该模型架构创新性地将多模态大语言模型与扩散Transformer相结合,模拟出两种不同思维模式,即缓慢深思的规划与迅捷直觉的反应。凭借这种强大的协同效应,该模型能够生成时长超一分钟的动态视频,视频中呈现出流畅的镜头运动、复杂的多角色互动以及高度动态的动作表现。


分享文章链接