共计 214 个字符,预计需要花费 1 分钟才能阅读完成。
FunASR 是由阿里巴巴智能计算研究院语音实验室开源的语音识别框架,集成了语音端点检测、语音识别、标点预测等领域的工业级模型的训练和部署,吸引了众多开发者参与体验和开发。FunASR 提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。目前多位网友表示 Paraformer 模型比 Whisper 在识别中文语音支持更好。
GitHub 地址:https://github.com/alibaba-damo-academy/FunASR
使用必剪 API 进行云端语音字幕识别的开源应用Bcut-ASR
估算应用和 AI agents的客户端token数量和价格的开源项目TokenCost