登录/注册
扫描二维码
手机浏览

阿里开源首个全模态大模型Qwen2.5-Omni,7B尺寸实现全球最强性能

新榜商桥
情报行业动态

新榜讯 3 月 27 日凌晨,阿里巴巴最新发布且开源了首个端到端全模态大模型——通义千问 Qwen2.5-Omni-7B。该模型能够同时应对文本、图像、音频以及视频等多种输入形式,并能够实时生成文本以及进行自然语音合成输出。在权威的多模态融合任务 OmniBench 等测评当中,Qwen2.5-Omni 一举刷新业界纪录,在全维度上大幅超越 Google 的 Gemini-1.5-Pro 等同类模型。Qwen2.5-Omni 能够以近似人类的多感官模式“立体”地认知世界,并与之进行实时交互,还能够通过音视频识别情绪,于复杂任务里作出更具智能化、更显自然的反馈与决策。


分享文章链接