新榜讯 财联社9月12日消息,阿里巴巴旗下通义千问重磅发布下一代基础模型架构Qwen3 - Next,同时开源了基于此架构的Qwen3 - Next - 80B - A3B系列模型。与Qwen3的MoE模型结构相比,该架构实现了多项核心改进,涵盖混合注意力机制、高稀疏度MoE结构、一系列利于训练稳定的优化举措,以及能提升推理效率的多token预测机制。
扫描二维码
手机浏览
阿里巴巴推出Qwen3-Next人工智能模型
分享文章链接
相似推荐

阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
新榜讯,阿里巴巴旗下通义千问新推出Qwen3 - Max - Preview(Instruct)模型。

阿里通义千问宣布更新旗舰版Qwen3模型
新榜讯 7月22日消息,阿里旗下通义千问宣布对旗舰版Qwen3模型进行更新,推出了Qwen3 - 235B - A22B - FP8非思考模式(Non - thinking)的更新版本,该版本被命名为Qwen3 - 235B - A22B - Instruct - 2507 - FP8。

阿里巴巴发布升级版Qwen3:全系适配苹果MLX架构
新榜讯 昨日,通义千问推出基于苹果MLX框架深度优化的全量Qwen3系列模型。