中国阿里云公司推出通义开源推理大模型QwQ,整体推理水平比肩OpenAI o1

2024-11-30  中国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据大半导体产业网11月29日消息,中国阿里云公司通义团队发布全新AI推理模型QwQ-32B-Preview并首次同步开源。评测数据显示,QwQ在解决复杂问题方面取得突破性进展,整体推理水平比肩OpenAI o1。在考察科学问题解决能力的GPQA评测集上,QwQ获得65.2%的准确率,具备研究生水平的科学推理能力;在涵盖综合数学主题的AIME评测中,QwQ以50%的胜率证明其拥有解决数学问题的丰富技能;在全面考察数学解题能力的MATH-500评测中,QwQ斩获90.6%的高分,超越o1-preview和o1-mini。

消息来源:https://www.semi.org.cn/site/semi/article/fa3320b00d474badb38fee7d2e0d51bc.html