新榜讯 据悉,2024 年 6 月,月之暗面 Kimi 与清华大学 MADSys 实验室携手发布 Kimi 底层的 Mooncake 推理系统设计方案。此系统凭借以 KVCache 为核心的 PD 分离及以存换算架构,提高了推理吞吐量。 近期,为推动该技术框架的应用及推广,月之暗面 Kimi 与清华大学 MADSys 实验室联合 9#AISoft、阿里云、华为存储、面壁智能、趋境科技等,共同发布开源项目 Mooncake,合力构建以 KVCache 为核心的大模型推理架构。 11 月 28 日,Mooncake 技术框架已开源上线。据相关介绍,Mooncake 开源项目由论文拓展而来,以超大规模 KVCache 缓存池为重点,借由以存换算的创新思维,大幅降低算力开销,增强了推理吞吐量。 此次开源将分阶段进行,逐步公开高性能 KVCache 多级缓存 Mooncake Store 的实现,同时对各类推理引擎以及底层存储/传输资源予以兼容。其中,传输引擎 Transfer Engine 部分现已在 GitHub 全球开源。Mooncake 开源项目的终极目标在于,为大模型时代塑造一种新型高性能内存语义存储的标准接口,并提供参考实现方案。
扫描二维码
手机浏览
月之暗面Kimi联合清华大学等开源大模型推理架构Mooncake
分享文章链接
相似推荐

清华系创企清程极智开源大模型推理引擎“赤兔Chitu”
新榜讯 清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣称,开源大模型推理引擎“赤兔 Chitu”。

清华大学与腾讯云达成战略合作,共探数据库与 AI 融合新范式
新榜讯 3 月 7 日,清华大学、腾讯云以及 intel 于北京共同宣布启动“数据库 AI 联合创新计划”。

月之暗面Kimi联合清华大学等机构开源共建大模型推理架构Mooncake
新榜讯 近日,月之暗面 Kimi 携手清华大学 MADSys 实验室,并联合 9#AISoft、阿里云、华为存储、面壁智能、趋境科技等产学研各方力量,共同发布开源项目 Mooncake,构建以 KVCache 为核心的大模型推理架构。