2023-09-29 美国 来源:其他 作者:唐乾琛 领域:信息
关键词:
据Huggingface网9月26日消息,美国微软公司公布了一款名为DeepSpeed-VisualChat的框架,旨在通过整合多模式功能来优化大语言模型的能力。据论文显示,DeepSpeed-VisualChat的重点是提高大语言模型处理交错输入方面的熟练程度。为此,该框架引入了创新的多模式因果注意机制,在现有数据集上利用数据混合技术来确保无缝多轮、多图像对话中的交互。与现有框架相比,DeepSpeed-VisualChat显示出高达700亿参数语言模型大小的卓越可扩展性。