美国英伟达公司发布全双工语音对话模型PersonaPlex-7B-v1,革新语音对话技术范式

2026-01-21  美国 来源:其他 领域:信息

关键词:

据DoNews网1月20日消息,美国英伟达公司发布基于Moshi架构的70亿参数全双工语音到语音对话模型PersonaPlex-7B-v1。该模型采用统一Transformer架构,在单一网络中同步处理语音理解与生成,支持自然打断、重叠语音、快速轮转及上下文感知的反馈词。同时,模型通过混合提示机制实现精准角色控制:音频提示定义音色与韵律,文本提示设定角色身份与业务场景,系统提示可包含名称、机构等结构化信息。在FullDuplexBench与ServiceDuplexBench评测中,其轮转接管率达90.8%,中断响应延迟低至240毫秒,显著优于现有开源及商用系统。该模型为智能语音交互、虚拟角色、客服助教等场景提供更自然流畅的对话能力,标志着语音对话技术从“级联管道”向“端到端统一”的范式跃升。