2025-01-18 中国 来源:其他 作者:刘纪铖 领域:信息
关键词:
据IT之家1月16日消息,中国人工智能企业面壁智能推出MiniCPM-o 2.6端侧全模态模型。该模型采用端到端多模态架构,也是首个支持在iPad等端侧设备上进行多模态实时交互流式的多模态大模型,可同时处理文本、图像、音频和视频等多种类型的数据,并生成高质量文本和语音输出。性能上,MiniCPM-o 2.6的视觉、语音和多模态流式能力是开源社区中模态支持最丰富、性能最佳的模型之一,其在综合了8个主流多模态评测基准中获得70.2的平均分,并在单图理解方面超越了GPT-4o-202405、Gemini 1.5 Pro和Claude 3.5 Sonnet等主流商用闭源多模态大模型。