微软开源创新音频模型VibeVoice-1.5B
来源:新浪网 | 2025-08-26 06:31:26


【资料图】

今天凌晨,微软研究院开源了创新音频模型VibeVoice-1.5B。VibeVoice-1.5B开创了语音界多个重大技术突破:一次性可连续合成90分钟超长逼真语音,之前多数模型只能合成60分钟以内语音,并且30分钟后会出现音色漂移、语义断裂等难题。

精彩推荐