登录/注册
扫描二维码
手机浏览

字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

新榜商桥
情报行业动态

新榜讯 4 月 10 日,字节跳动豆包大模型团队重磅开源首个多语言类 SWE 数据集——Multi-SWE-bench。该数据集能够用于评估并增强大模型“自动修 Bug”的能力。在 SWE-bench 的基础之上,Multi-SWE-bench 开创性地涵盖了除 Python 之外的 7 种主流编程语言,成为名副其实面向“全栈工程”的评测基准。其数据全部源自 GitHub issue,历经近一年时间精心构建,旨在尽可能精准地测评及提升大模型高阶编程的智能水平。


分享文章链接