新榜讯 当地时间 10 月 30 日,美国开放人工智能研究中心(OpenAI)宣称,为对语言模型的真实性予以衡量,将开源名为 SimpleQA 的新基准。此基准能够衡量语言模型针对简短的事实寻求(fact-seeking)问题的回答能力。
扫描二维码
手机浏览
OpenAI将开源SimpleQA新基准,以衡量大模型真实性
分享文章链接
相似推荐

OpenAI升级其转录及语音生成AI模型
新榜讯 当地时间 3 月 20 日,美国开放人工智能研究中心(OpenAI)宣布,已将全新的转录及语音生成 AI 模型引入其 API 接口,且表示这些模型较此前版本有显著提升。

阿里通义千问开源模型下载量突破2亿
新榜讯 今日,在人工智能赋能科学研究研讨会上,阿里巴巴副总裁、大数据和智能实验室负责人叶杰平披露,截至当下,阿里通义千问开源模型的下载量达 2 亿,基于阿里通义模型的衍生模型数量超 9 万个。

MiniMax发布并开源新一代01系列模型
新榜讯 MiniMax 重磅发布并开源新一代 01 系列模型,其中涵盖基础语言大模型 MiniMax-Text-01 以及视觉多模态大模型 MiniMax-VL-01 。