以自己托管的 开源Whisper 解决方案「VoiceStreamAI」

115次阅读
没有评论

共计 205 个字符,预计需要花费 1 分钟才能阅读完成。

VoiceStreamAI 是一款可以自己托管的 开源 Whisper 解决方案,服务端是 Python,客户端是 JavaScript,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。该系统采用 Huggingface 的声活动检测(VAD)和 OpenAI 的 Whisper 模型进行准确的语音识别和处理。

GitHub 地址:https://github.com/alesaccoia/VoiceStreamAI

以自己托管的 开源 Whisper 解决方案「VoiceStreamAI」

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-12-30发表,共计205字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。
评论(没有评论)
验证码