中日研究人员在情感语音转换(VC)技术领域取得新进展

2022-08-25  美国 来源:其他 作者:唐乾琛 领域:信息

关键词:

据中国科技网8月23日消息,中国内蒙古大学与日本大阪大学组成的研究团队在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”的最新研究成果。情感语音转换(VC)旨在将中性语音转换为情感声音,同时保留语言信息和说话者的身份特征。研究团队针对情感语音转换的声学特征解耦问题开展研究,提出了一种基于“源-滤波器”模型的情感语音转换系统。具体而言,这是一种为了解决情感语音转换的特征解耦问题而提出的一种新型情感VC模型(简称SFEVC),能从音色和音调特征中准确过滤说话人独立的情感线索。此外,研究团队还提出了基于二维VA(激活度-效价)空间的训练策略。实验结果表明,SFEVC模型以及VA训练策略的表现均优于所有基线系统,并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。

消息来源:http://www.stdaily.com/index/kejixinwen/202208/3bd94e3402714029981dd9608b95d043.shtml