新榜讯 最新发布的2024年3月版《SuperBench大模型综合能力评测报告》是由清华大学基础模型研究中心与中关村实验室联合研制的。这次评测涵盖了14个具有代表性的国内外模型。在人类对齐能力评测中,文心一言4.0在中文推理和中文语言等方面表现出色,凭借高分明显领先其他模型。在中文理解方面,文心一言4.0也遥遥领先,超过第二名GLM-4 0.41分的差距。相比之下,GPT-4系列模型在评测中的表现较差,排名位于中下游,与第一名文心一言4.0的得分相差超过1分。