美德研究团队推出史上最大多模态视觉语言模型PaLM-E,参数达5620亿

2023-03-10  中国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据财联社3月8日消息,美国谷歌公司与德国柏林工业大学的联合研究团队推出史上最大多模态视觉语言模型PaLM-E,参数达5620亿。PaLM-E主要特征为:集视觉、语言于一体,可分析图片和识别语言;具备嵌入式功能,可与实体机器人相结合使用;无需重复训练,具备实时自我学习能力;具备推理、预测能力,可从指定任务中学习并实现更复杂的推理等。未来该模型可应用于工业、商业、办公等领域的机器人技术领域。该模型并未开源,相关研究发表在预印本网站arXiv上。

消息来源:https://baijiahao.baidu.com/s?id=1759792336439153300&wfr=spider&for=pc