开源音频、音乐和语音生成工具包Amphion

128次阅读
没有评论

共计 413 个字符,预计需要花费 2 分钟才能阅读完成。

Amphion 是一款开源音频、音乐和语音生成工具包,由香港中文大学(深圳)吴志正教授领导的团队开发,该工具包是与 OpenMMLab 合作开发的。此工具包支持文本转语音(TTS)、歌声合成(SVS)、语音转换(VC)、歌声转换(SVC)、文本转音频(TTA)、文本转音乐(TTM),最吸引人关注的就是歌声转换(SVC)工具,可以将一首歌的声音换成另一个歌手的声音,歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构,如 FastSpeech2、VITS、Vall-E、NaturalSpeech2 等,用于不同的音频生成任务。

GitHub 地址:https://github.com/open-mmlab/Amphion

论文地址:arxiv.org/abs/2312.09911

HuggingFace 地址:https://huggingface.co/amphion

开源音频、音乐和语音生成工具包 Amphion

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-12-21发表,共计413字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。
评论(没有评论)
验证码