2024-02-20 美国 来源:其他 作者:刘纪铖 领域:信息
关键词:
据TechXplore网2月17日消息,美国亚马逊公司推出有史以来最大的文本转语音模型BASE TTS,展现出涌现能力。BASE TTS拥有9.8亿个参数,并使用10万小时的录音进行训练,其中大部分为英语语音。亚马逊团队还测试了使用较小数据集的模型,发现在参数量达到1.5亿的中型数据集上,会展现出涌现能力。亚马逊表示,出于对潜在滥用风险的担忧,BASE TTS将不会向公众开放,只作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。
消息来源:https://techxplore.com/news/2024-02-amazon-unveils-largest-text-speech.html