开源Whisper 客户端「Transcribe Audio」,基于 OpenAI API 进行语音转文字

714次阅读
没有评论

共计 612 个字符,预计需要花费 2 分钟才能阅读完成。

Whisper 是 OpenAI 旗下的开源语音识别系统,可以将人类的语音指令转换成计算机可识别的文本形式,从而实现语音输入。简单来说 Whisper 支持将语音转换为文字,支持多种语言,尤其是在英语语音识别方面的稳健性和准确性接近人类水平,Whisper 可以在不同的平台和设备上运行。今天给大家介绍一款基于 OpenAI API 的开源 Whisper 客户端「Transcribe Audio」,可以直接运行在本地电脑也可以运行在主机上。

开源 Whisper 客户端「Transcribe Audio」,基于 OpenAI API 进行语音转文字

Transcribe Audio

Transcribe Audio 是一个非常简易的开源 Whisper 客户端,它只有三个文件:index.html、index.js、style.css,只需要下载、解压缩,将 index.html 拖到浏览器里就可以使用,也可以将这些文件上传到主机空间绑定域名进行访问。在顶部输入你的 OpenAI API key(和 ChatGPT 同一个),就可以选择音频文件进行转换,支持保存为文本、.srt、.vtt 三种格式。

支持上传音频格式:mp3、mp4、mpeg、mpga、m4a、wav、webm、mp4、mpeg、webm

开源地址:https://github.com/felixbade/transcribe

官方 DEMO:https://transcribe.bloat.app

开源 Whisper 客户端「Transcribe Audio」,基于 OpenAI API 进行语音转文字

API 价格

  • Whisper API 价格为 $0.006 / 分钟

开源 Whisper 客户端「Transcribe Audio」,基于 OpenAI API 进行语音转文字

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-05-23发表,共计612字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。