扫描二维码
手机浏览

Kimi发布技术报告改进模型结构,马斯克称“令人印象深刻”

新榜商桥
情报行业动态

新榜讯 ,3月16日,月之暗面Kimi发布技术报告,对大模型核心结构残差连接进行重新设计。该结构在过去十年都未有根本性变化,此次重新设计让每一层可选择性关注此前各层输出,而非进行统一求和。测试结果表明,48B模型训练效率提升了1.25倍。此项研究由Kimi联合创始人杨植麟、吴育昕、周昕宇等人共同完成。论文发布后,马斯克发文评价“令人印象深刻”。


分享文章链接