中国稀宇科技公司发布并开源MiniMax 01系列模型,首次大规模实现线性注意力机制

2025-01-17  中国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据品玩网1月15日消息,中国稀宇科技(MiniMax)公司发布并开源MiniMax 01系列模型,首次大规模实现线性注意力机制。该系列模型打破传统Transformer架构瓶颈,参数量高达4560亿,上下文窗口长度达400万token,是GPT-4o模型的32倍,Claude-3.5-Sonnet模型的20倍,模型综合性能比肩海外顶尖模型。该系列模型的推出将满足AI智能体对持续记忆和通信能力的更高要求,迈出建立复杂AI智能体基础能力的第一步。

消息来源:https://www.pingwest.com/w/301807