新榜讯 当地时间 10 月 30 日,美国开放人工智能研究中心(OpenAI)宣称,为对语言模型的真实性予以衡量,将开源名为 SimpleQA 的新基准。此基准能够衡量语言模型针对简短的事实寻求(fact-seeking)问题的回答能力。