新榜讯 阿里通义大模型继续登顶开源界,Qwen2系列最新成员Qwen2-Audio重磅亮相!该模型无需文本输入,直接进行语音问答,解析用户输入的音频信号,涵盖人声、自然音、音乐等,表现远超同类产品,多次在全球权威评测中夺冠。与此同时,通义团队还推出了全新的音频理解模型测评标准,有望入选本周国际知名学术会议ACL 2024!
扫描二维码
手机浏览
阿里通义开源音频语言模型Qwen2-Audio,相关论文入选顶会ACL 2024
分享文章链接
相似推荐

通义大模型开源发布3D数字人大模型
新榜讯 4 月 7 日,通义大模型重磅宣布开源发布超写实 3D 数字人大模型(LAM)。

阿里通义千问登顶全球开源模型榜首
新榜讯 全球最大的 AI 开源社区 Hugging Face 大模型榜单迎来更新,近期阿里通义千问开源的端到端全模态大模型 Qwen2.5-Omni 荣登总榜首位,DeepSeek-V3-0324 与群核的 SpatialLM-Llama-1B 依次位居其后,杭州公司成功包揽全球开源模型榜单前三甲。

阿里云通义开源首个多模态推理模型QVQ
新榜讯 12 月 25 日,阿里云通义千问重磅推出首个开源多模态推理模型 QVQ-72B-Preview。