OpenAI发布CoT监控阻止大模型恶意行为

新媒体，找新榜
NewMedia , NewRank

新榜（上海新榜信息技术股份有限公司）于2014年11月11日起正式运营，目前在上海、北京、成都、广州、长沙设有办公室......

©2026 NEWRANK

关于新榜

2024新榜大会

白皮书《2024内容产业年度报告》数据生态报告《内容生态数据报告暨2024展望》

资质&荣誉

国家级高新技术企业

上海市专精特新企业

上海数字广告领军企业

上海文化企业十佳

上海市第五届十佳创业新秀

北京市文化创意创新创业大赛100强企业

北京市最具投资价值文化创意企业50强

中国年度创新成长企业100强

全国内容科技创新创业大赛一等奖

中国广告新媒体贡献年度大奖

中国商务广告协会自媒体委员会突出贡献奖

第六届中国国际进口博览会溢出效应论坛“展品变商品”TOP30服务平台

巨量星图最佳合作服务商

巨量引擎&巨量星图默契服务商

巨量引擎服务突破合作伙伴

巨量星图极致贡献合作伙伴

小红书蒲公英优质代理商

小红书蒲公英渠道最佳合作代理商

小红书渠道最具影响力合作伙伴

小红书年度增长力商业合作伙伴

腾讯广告互选平台卓越金牌伙伴

腾讯广告互选平台视频号突破伙伴

哔哩哔哩花火商业合作平台核心代理商

快手磁力引擎最佳创新营销代理

30+服务行业

1万+服务客户

近80亿营业额

新榜指数历届新榜大会新榜介绍

榜单

覆盖公众号、小红书、抖音等多个新媒体平台账号的综合影响力榜单（日、周、月）

©2026 NEWRANK

平台榜

百家号春风计划MCN机构榜、达人榜

搜狐视频自媒体影响力排行榜

字节跳动公益影响力排行榜

快手MCN影响力排行榜

腾讯公益内容生态发展指数

区域榜

北京微信影响力排行榜

青岛财经微信影响力排行榜

辽宁微信影响力排行榜

贵州微信影响力排行榜

湖北微信影响力排行榜

行业榜

中国黄金珠宝品牌抖音号影响力排行榜

汽车企业抖音影响力排行榜

中国母婴亲子微信影响力排行榜

中国体育微信影响力排行榜

中国高校微信影响力排行榜

新榜榜单权威的新媒体影响力排行榜

轻松做创作，快速取数据

提供文案，图片，标题，违禁词等创作者相关小工具；涵盖评论，账号，作品等多维度的开箱即用数据工具集合

前往数据工具

©2026 NEWRANK

投放变现

找号做投放，品效加种草
致力于为品牌方、商家提供一站式推广营销服务

©2026 NEWRANK

社媒营销推广

公众号投放

实现批量高效的私域获客

全平台素人推广

微信群投放

APP社媒推广

文旅新媒体营销🌴

KOL代理投放

小红书聚光投放

达人变现服务

公众号接单

每一个阅读数都可以赚钱

微信群变现

新榜有赚找号做投放，品效加种草

素人观察长尾流量营销指南

新媒体数字资产管理

助力企业数字化转型
实现内容资产高效的获取与精准管理，提升品牌影响力

©2026 NEWRANK

管矩阵账号

matrix.newrank.cn

多平台新媒体矩阵一站式管理、数字化提效、智能化分析

账号统筹管理

任务派发追踪

运营效果评估

积分激励兑换

内容合规管控

AI问答/创作/分析

听社媒声音

voice.newrank.cn

社媒全域声量实时监测、内容智能分析、声誉高效管理

看趋势，了解品牌声量

听声音，洞察用户偏好

管声誉，发现品牌正负面舆情

做对比，明确竞争优势

汇投放数据

助力品牌管理多平台营销投放数据，投放复盘、达人管理、竞品跟踪

留存投放资产

复盘投放效果

优化投放策略

扩宽行业视角

汇GEO数智

洞察品牌在AI回答中的提及，并行动

GEO场景速查及打点追踪

用户真实问题挖掘

创作优化/引用率倒查/信源穿刺

已支持豆包/元宝/DeepSeek/Kimi等6大AI平台

增值服务：提供如体系培训、走访研学、数字大屏、咨询报告、定制API等

扫描二维码

手机浏览

OpenAI发布CoT监控阻止大模型恶意行为

新榜商桥2025-03-11

情报

行业动态

新榜讯 OpenAI 最新研究成果显示，通过采用 CoT（思维链）监控手段，能够有效阻止大模型诸如胡说八道、隐藏真实意图等恶意行为，成为监督超级模型的有力工具之一。此次，OpenAI 将最新发布的前沿模型 o3-mini 当作被监控对象，而以相对较弱的 GPT-4o 模型充任监控器。测试是在编码任务环境下进行的，要求 AI 在代码库中实现功能并通过单元测试。最终结果表明，CoT 监控器在检测系统性“奖励黑客”行为时表现出色，召回率高达 95%，远远高于仅监控行为的 60%。

分享文章链接

中国信通院启动大模型应用交付生态图谱编制

新榜讯随着人工智能产业蓬勃发展，大模型技术已成为推动行业变革的关键所在。

Gmail新增由Gemini驱动的“添加到日历”按钮

新榜讯谷歌的 Gemini 人工智能驱动的一项实用新功能现已面向谷歌 Workspace 用户推出。

相似推荐

阿里发布Qwen3.7-Plus多模态智能体模型

新榜讯千问大模型官微消息显示，6月2日，阿里重磅发布Qwen3.7 - Plus多模态智能体模型。

阿里千问模型Qwen3.7-MaX发布

新榜讯 5月20日讯，千问大模型今日官宣正式发布面向智能体时代的新一代旗舰模型Qwen3.7 - Max，该模型即将通过API提供服务。

高德正式布局世界模型，高德将发布世界模型产品

新榜讯，阿里巴巴旗下高德已悄然布局世界模型，且正计划基于该世界模型推出全新产品应用。

中国信通院启动大模型应用交付生态图谱编制

新榜讯随着人工智能产业蓬勃发展，大模型技术已成为推动行业变革的关键所在。

Gmail新增由Gemini驱动的“添加到日历”按钮

新榜讯谷歌的 Gemini 人工智能驱动的一项实用新功能现已面向谷歌 Workspace 用户推出。