美国微软公司发布多模态AI模型Magma,可实现自主式互动

2025-02-25  美国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据品玩网2月20日消息,美国微软公司发布多模态AI模型Magma,可实现自主式互动。Magma可处理文字、图像和视频等多模态数据,并在视觉空间世界中规划和行动,例如执行UI导航或控机器人等任务。微软表示,Magma能有效地从公开的视觉和语言数据中转移知识,将语言和空间智能结合起来,以应对复杂的任务。Magma是从大型语言模型和聊天机器人转向AI代理(AI Agent)趋势的一部分,AI代理可以代表人类执行任务。但这项技术仍存在技术限制,例如OpenAI最近发布的AI代理Operator,虽然设计用于浏览互联网并执行任务,但仍需要大量的人工监督。

消息来源:https://www.pingwest.com/w/302478