登录/注册
扫描二维码
手机浏览

豆包大模型团队开源基准测试集SuperGPQA

新榜商桥
情报行业动态

新榜讯 3 月 4 日,豆包大模型团队于近日开源SuperGPQA。这是一个在领域方面十分全面且具有高区分度的知识推理基准测试。此数据集成功构建起涵盖 285 个研究生级学科,包含 26529 道专业问题的评估体系。不但囊括了主流学科,还将轻工业、农业、服务科学等长尾学科收纳其中。充分彰显出全面学科的覆盖广度,成功填补了长尾知识评估领域的空白。


分享文章链接