Meta推出语音生成大模型产品Voicebox,可进行去噪、内容修改、风格转换

204次阅读
没有评论

共计 378 个字符,预计需要花费 1 分钟才能阅读完成。

Meta 推出大模型产品 Voicebox,这是一款语音生成产品。据 Meta 表示,Voicebox 可以合成英语、法语、德语、西班牙语等六种不同语言的语音,除了可以根据文本生成语音内容外,还可以进行去噪、内容修改,风格转换等任务。该模型基于 Flow Matching 技术,可以对扩散模型进行改进。Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型,表明 Voicebox 更先进,在比较单词错误率和样式相似性时优于两种模型。

论文地址:https://research.facebook.com/publications/voicebox-text-guided-multilingual-universal-speech-generation-at-scale

官方 Demo:https://voicebox.metademolab.com

Meta 推出语音生成大模型产品 Voicebox,可进行去噪、内容修改、风格转换

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-06-18发表,共计378字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。