中国DeepSeek发布全新视觉编码器DeepSeek OCR2,视觉Token消耗锐减80%

2026-02-03  中国 来源:https://news.aibase.com/zh/news/25174 领域:信息

关键词:

据AIbase网2月2日消息,中国DeepSeek发布全新视觉编码器DeepSeek OCR2。该模型引入全新的轻量级语言模型架构,利用“因果流 Token”对视觉信息进行重新排列和上下文整合,实现模拟人类视觉的灵活扫描模式,在文档处理和图像识别领域实现重大突破,彻底颠覆了传统视觉模型平铺直叙的处理逻辑。在相同的图像处理任务中,DeepSeek OCR2仅需256到1120个Token,相比同类系统通常消耗的6000个以上Token,其视觉Token消耗量锐减80%以上。在权威的OmniDocBench基准测试中,该模型以91.09%的高分刷新纪录,在文档解析性能上全面超越了Gemini3Pro。