登录/注册
扫描二维码
手机浏览

阿里巴巴推出Qwen3-Next人工智能模型

新榜商桥
情报行业动态

新榜讯 财联社9月12日消息,阿里巴巴旗下通义千问重磅发布下一代基础模型架构Qwen3 - Next,同时开源了基于此架构的Qwen3 - Next - 80B - A3B系列模型。与Qwen3的MoE模型结构相比,该架构实现了多项核心改进,涵盖混合注意力机制、高稀疏度MoE结构、一系列利于训练稳定的优化举措,以及能提升推理效率的多token预测机制。


分享文章链接