新榜讯 近日,北京智源研究院的顶尖项目FlagEval天秤大模型评测平台完成了全面升级,并隆重公布了202406期FlagEval模型评测排行榜。根据最新发布的榜单显示,百度文心大模型4.0以惊人的89.72分的综合评分,在闭源对话模型中成功登顶第一的宝座。