美国xAI发布Grok 4,性能媲美GPT-5、Claude 4 Opus等业内顶级模型

2025-07-11  全球 来源:其他 领域:信息

关键词:

据MIT科技评论网7月10消息,美国xAI发布最新旗舰AI大模型Grok4。据介绍,Grok 4在xAI的Colossus超级计算机上进行了训练,能做到GRE任何学科接近满分,推理能力甚至已经超越人类的推理水平。性能上,Grok 4拥有25.6万token的上下文窗口,其推理能力相较于前代提升了10倍,主打多模态功能,支持更复杂的交互形式,同时具备更快的推理速度和改进的用户界面,弥补了此前该系列模型不支持图像与视频的不足。在主流推理基准测试中,在未使用工具的情况下,Grok 4 在HLE(人类的最后考试)测试中的得分是25.4%,而使用工具后,分数则飙升至38.6%,其更强版本Grok 4 Heavy则拿到了44.4% 的高分,碾压目前表现最好的谷歌Gemini 2.5 Pro(26.9%)。此外,Grok 4还计划接入特斯拉汽车系统。