新榜讯 全球知名开源平台Huggingface的联合创始人兼首席执行官Clem在社交平台上表示,他们为了推出全新的开源大模型排行榜进行了一次大规模的评估。该评估涵盖了目前全球100多个主流开源大模型,如Qwen2、Llama-3、mixtral、Phi-3等,并在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全面测试。最终结果显示,阿里巴巴最新发布的开源模型Qwen2-72B指令微调版本荣登榜首,显示出中国在全球开源大模型领域的领导地位。
新榜讯 全球知名开源平台Huggingface的联合创始人兼首席执行官Clem在社交平台上表示,他们为了推出全新的开源大模型排行榜进行了一次大规模的评估。该评估涵盖了目前全球100多个主流开源大模型,如Qwen2、Llama-3、mixtral、Phi-3等,并在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全面测试。最终结果显示,阿里巴巴最新发布的开源模型Qwen2-72B指令微调版本荣登榜首,显示出中国在全球开源大模型领域的领导地位。