新榜讯 近日,北京智源研究院的顶尖项目FlagEval天秤大模型评测平台完成了全面升级,并隆重公布了202406期FlagEval模型评测排行榜。根据最新发布的榜单显示,百度文心大模型4.0以惊人的89.72分的综合评分,在闭源对话模型中成功登顶第一的宝座。
扫描二维码
手机浏览
智源最新模型评测:百度文心大模型4.0登顶闭源榜
分享文章链接
相似推荐
《通用大模型评测标准》发布
新榜讯 此次发布的评测标准依托“2-4-6”框架:其中,“2”涵盖两类评测视角,以重点行业的实际使用需求为指引,将评测任务细分为理解和生成两类;“4”包含四类评测要素,于评测的全生命周期里提炼出评测工具、评测数据、评测方式以及评测指标这四类关键要素;“6”象征着六大评测维度,全面考量大模型应用进程中的核心能力。
百度文心智能体平台免费开放文心4.0
新榜讯 百度最新官方消息显示,百度文心智能体平台(AgentBuilder)正式宣布免费开放文心大模型4.0。
报道称百度文心大模型5.0将在2025年发布
新榜讯 根据知情人士透露,百度有望在2025年的百度世界大会上发布全新一代文心大模型5.0。