美国苹果公司发布多模态大模型MM1.5

2024-10-15  中国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据品玩网10月14日消息,美国苹果公司发布多模态大模型MM1.5。MM1.5在MM1架构的基础上训练而成,MM1.5采用了以数据为中心的模型训练方法,在整个模型训练生命周期中系统地探索各种数据混合物的影响。MM1.5的模型参数范围从1B到30B,包括密集型和专家混合型(MoE)变体,并证明了精心的数据整理和训练策略即使在小范围内也能产生强大的性能(1B和3B)。

消息来源:https://www.pingwest.com/w/299059