新榜讯 近日,DeepSeek重磅推出新型数学推理模型DeepSeekMath - V2,此模型采用可自我验证的训练框架。它基于DeepSeek - V3.2 - Exp - Base构建而成,借助LLM验证器自动审查生成的数学证明,并且利用高难度样本持续优化性能。在IMO 2025和CMO 2024赛事中,该模型均达到金牌水平,在Putnam 2024中更是斩获118/120分的优异成绩。研发团队表示,这一成果验证了自验证推理路径的可行性,为构建可靠数学智能系统提供了全新方向。目前,该模型代码与权重已在Hugging Face及GitHub平台开源发布。











- 多平台社媒聆听









