美国谷歌公司发布大模型AudioPaLM,可实现能说能听功能

2023-06-27  美国 来源:其他 作者:刘纪铖 领域:信息

关键词:

据站长之家6月25日消息,美国谷歌公司发布大模型AudioPaLM,可实现能说能听功能。AudioPaLM结合了两个现有模型的优势,即PaLM-2模型和AudioLM模型,以产生一个统一的多模态架构,能够处理和生成文本和语音。通过结合这两个模型,AudioPaLM利用了PaLM-2的语言专业知识和AudioLM的附加语言信息保存能力,从而更全面地理解和生成文本和语音。经过评估,AudioPaLM在语音翻译方面的表现明显优于现有系统,展现出对语言组合执行零样本语音到文本翻译的能力,也就是说,它可以准确地将从未遇到过的语言的语音翻译成文本,为更广泛的语言支持开辟了可能性。

消息来源:https://www.pingwest.com/w/284341