共计 413 个字符,预计需要花费 2 分钟才能阅读完成。
Amphion 是一款开源音频、音乐和语音生成工具包,由香港中文大学(深圳)吴志正教授领导的团队开发,该工具包是与 OpenMMLab 合作开发的。此工具包支持文本转语音(TTS)、歌声合成(SVS)、语音转换(VC)、歌声转换(SVC)、文本转音频(TTA)、文本转音乐(TTM),最吸引人关注的就是歌声转换(SVC)工具,可以将一首歌的声音换成另一个歌手的声音,歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构,如 FastSpeech2、VITS、Vall-E、NaturalSpeech2 等,用于不同的音频生成任务。
GitHub 地址:https://github.com/open-mmlab/Amphion
论文地址:https://arxiv.org/abs/2312.09911
HuggingFace 地址:https://huggingface.co/amphion
正文完
关注公众号获取最新教程
发表至:无分类
2023-12-21