全球技术地图

全球

欧盟

英国

中国

美国

印度

以色列

日本

其他

美国谷歌公司发布大模型AudioPaLM，可实现能说能听功能

2023-06-27 美国来源：其他作者：刘纪铖领域：信息

关键词：

据站长之家6月25日消息，美国谷歌公司发布大模型AudioPaLM，可实现能说能听功能。AudioPaLM结合了两个现有模型的优势，即PaLM-2模型和AudioLM模型，以产生一个统一的多模态架构，能够处理和生成文本和语音。通过结合这两个模型，AudioPaLM利用了PaLM-2的语言专业知识和AudioLM的附加语言信息保存能力，从而更全面地理解和生成文本和语音。经过评估，AudioPaLM在语音翻译方面的表现明显优于现有系统，展现出对语言组合执行零样本语音到文本翻译的能力，也就是说，它可以准确地将从未遇到过的语言的语音翻译成文本，为更广泛的语言支持开辟了可能性。

消息来源：https://www.pingwest.com/w/284341