2025-11-28 中国 来源:https://news.aibase.com/zh/news/23185 领域:信息
关键词:
据AIbase网11月28日消息,DeepSeek正式发布DeepSeek-Math-V2。该模型基于 DeepSeek-V3.2实验版基础架构开发,为6850亿参数的混合专家(MoE)模型,已以 Apache2.0开源协议完整放出权重。该模型最引人注目的突破在于其开创性的“生成-验证”双模型闭环机制,通过配备专门的验证器(verifier),对生成器输出的每一步证明进行实时逻辑审查,真正意义上获得了“可自我验证”能力。DeepSeek-Math-V2在数学推理能力上实现了质的飞跃。例如,在谷歌DeepMind主导的IMO-ProofBench正式推理基准上,DeepSeek-Math-V2在基础难度获得99% 正确率,在高难度部分取得61.9%,全面超越此前所有公开模型。这一“可自我验证”能力不仅大幅提升了模型的证明质量,也为未来在药物设计、密码学、形式化验证等需要极高可信度的场景中部署人工智能奠定了基础。