豆包大模型团队开源基准测试集SuperGPQA

新媒体，找新榜
NewMedia , NewRank

新榜（上海新榜信息技术股份有限公司）于2014年11月11日起正式运营，目前在上海、北京、成都、广州、长沙设有办公室......

©2026 NEWRANK

关于新榜

2024新榜大会

白皮书《2024内容产业年度报告》数据生态报告《内容生态数据报告暨2024展望》

资质&荣誉

国家级高新技术企业

上海市专精特新企业

上海数字广告领军企业

上海文化企业十佳

上海市第五届十佳创业新秀

北京市文化创意创新创业大赛100强企业

北京市最具投资价值文化创意企业50强

中国年度创新成长企业100强

全国内容科技创新创业大赛一等奖

中国广告新媒体贡献年度大奖

中国商务广告协会自媒体委员会突出贡献奖

第六届中国国际进口博览会溢出效应论坛“展品变商品”TOP30服务平台

巨量星图最佳合作服务商

巨量引擎&巨量星图默契服务商

巨量引擎服务突破合作伙伴

巨量星图极致贡献合作伙伴

小红书蒲公英优质代理商

小红书蒲公英渠道最佳合作代理商

小红书渠道最具影响力合作伙伴

小红书年度增长力商业合作伙伴

腾讯广告互选平台卓越金牌伙伴

腾讯广告互选平台视频号突破伙伴

哔哩哔哩花火商业合作平台核心代理商

快手磁力引擎最佳创新营销代理

30+服务行业

1万+服务客户

近80亿营业额

新榜指数历届新榜大会代理服务新榜介绍联系我们

榜单

覆盖公众号、小红书、抖音等多个新媒体平台账号的综合影响力榜单（日、周、月）

©2026 NEWRANK

平台榜

百家号春风计划MCN机构榜、达人榜

搜狐视频自媒体影响力排行榜

字节跳动公益影响力排行榜

快手MCN影响力排行榜

腾讯公益内容生态发展指数

区域榜

北京微信影响力排行榜

青岛财经微信影响力排行榜

辽宁微信影响力排行榜

贵州微信影响力排行榜

湖北微信影响力排行榜

行业榜

中国黄金珠宝品牌抖音号影响力排行榜

汽车企业抖音影响力排行榜

中国母婴亲子微信影响力排行榜

中国体育微信影响力排行榜

中国高校微信影响力排行榜

新榜榜单权威的新媒体影响力排行榜

轻松做创作，快速取数据

提供文案，图片，标题，违禁词等创作者相关小工具；涵盖评论，账号，作品等多维度的开箱即用数据工具集合

前往数据工具

©2026 NEWRANK

投放变现

找号做投放，品效加种草
致力于为品牌方、商家提供一站式推广营销服务

©2026 NEWRANK

社媒营销推广

公众号投放

实现批量高效的私域获客

全平台素人推广

微信群投放

APP社媒推广

文旅新媒体营销🌴

KOL代理投放

小红书聚光投放

达人变现服务

公众号接单

每一个阅读数都可以赚钱

微信群变现

新榜有赚找号做投放，品效加种草

素人观察长尾流量营销指南

新媒体数字资产管理

助力企业数字化转型
实现内容资产高效的获取与精准管理，提升品牌影响力

©2026 NEWRANK

管矩阵账号

matrix.newrank.cn

多平台新媒体矩阵一站式管理、数字化提效、智能化分析

账号统筹管理

任务派发追踪

运营效果评估

积分激励兑换

内容合规管控

AI问答/创作/分析

听社媒声音

voice.newrank.cn

社媒全域声量实时监测、内容智能分析、声誉高效管理

看趋势，了解品牌声量

听声音，洞察用户偏好

管声誉，发现品牌正负面舆情

做对比，明确竞争优势

汇投放数据

助力品牌管理多平台营销投放数据，投放复盘、达人管理、竞品跟踪

留存投放资产

复盘投放效果

优化投放策略

扩宽行业视角

汇GEO数智

洞察品牌在AI回答中的提及，并行动

GEO场景速查及打点追踪

用户真实问题挖掘

创作优化/引用率倒查/信源穿刺

已支持豆包/元宝/DeepSeek/Kimi等6大AI平台

增值服务：提供如体系培训、走访研学、数字大屏、咨询报告、定制API等

扫描二维码

手机浏览

豆包大模型团队开源基准测试集SuperGPQA

新榜商桥2025-03-04

情报

行业动态

新榜讯 3 月 4 日，豆包大模型团队于近日开源SuperGPQA。这是一个在领域方面十分全面且具有高区分度的知识推理基准测试。此数据集成功构建起涵盖 285 个研究生级学科，包含 26529 道专业问题的评估体系。不但囊括了主流学科，还将轻工业、农业、服务科学等长尾学科收纳其中。充分彰显出全面学科的覆盖广度，成功填补了长尾知识评估领域的空白。

分享文章链接

菜鸟获“2024吴文俊科技进步奖”

新榜讯近日，2024 年度中国人工智能科学技术领域的重要奖项——吴文俊人工智能科学技术奖评审结果揭晓。

万里汇携手全球金融机构，为百万跨境企业处理超3000亿美元交易额

新榜讯近日，蚂蚁国际旗下的一站式数字支付与金融服务平台万里汇于新加坡举办全球金融合作伙伴日活动。

相似推荐

阿里千问开源模型数量突破400个

1月28日消息，全球最大开源社区Hugging Face最新数据显示，阿里千问大模型开源数量突破400个，是全球AI开源社区采用率最高的模型。

豆包大模型1.8发布，Seedance模型同步升级

新榜讯今日，火山引擎Force原动力大会召开，字节跳动在会上正式推出豆包大模型1.8以及音视频创作模型Seedance 1.5 pro。

火山引擎正式发布豆包编程模型

新榜讯 11月11日讯，火山引擎重磅发布豆包编程模型（Doubao - Seed - Code）。

菜鸟获“2024吴文俊科技进步奖”

新榜讯近日，2024 年度中国人工智能科学技术领域的重要奖项——吴文俊人工智能科学技术奖评审结果揭晓。

万里汇携手全球金融机构，为百万跨境企业处理超3000亿美元交易额

新榜讯近日，蚂蚁国际旗下的一站式数字支付与金融服务平台万里汇于新加坡举办全球金融合作伙伴日活动。