共计 378 个字符,预计需要花费 1 分钟才能阅读完成。
Meta 推出大模型产品 Voicebox,这是一款语音生成产品。据 Meta 表示,Voicebox 可以合成英语、法语、德语、西班牙语等六种不同语言的语音,除了可以根据文本生成语音内容外,还可以进行去噪、内容修改,风格转换等任务。该模型基于 Flow Matching 技术,可以对扩散模型进行改进。Meta 还比较了 Voicebox 和 Vall-E、YourTTS 等其它音频 AI 模型,表明 Voicebox 更先进,在比较单词错误率和样式相似性时优于两种模型。
官方 Demo:https://voicebox.metademolab.com
正文完
关注公众号获取最新教程

发表至: AI新品
2023-06-18