共计 905 个字符,预计需要花费 3 分钟才能阅读完成。
AI 语音克隆和文本转语音 API 领域的初创公司 ElevenLabs 近日宣布了一项新功能,允许用户在其开发者平台上构建具有高度定制性的对话式 AI 机器人。这一新功能不仅增强了 ElevenLabs 的服务范围,也为开发者和企业提供了更灵活的对话代理解决方案。
新功能亮点:
- 定制对话代理: 用户可以在 ElevenLabs 平台上创建完整的对话代理,定制变量包括语音语调、响应长度等。
- 多样化的声音和 AI 工具: ElevenLabs 专注于为文本转语音服务提供多样化的声音和 AI 工具,满足不同客户的需求。
- 整合知识库: 公司面临的挑战之一是整合知识库和处理客户的打断,这也是 ElevenLabs 构建对话机器人完整管道的原因。
- 项目创建与模板: 用户可以通过选择模板或创建新项目来开始构建对话代理,定制代理的主要语言、第一条消息和系统提示。
- 语言模型选择: 开发者可以选择不同的大语言模型(如 Gemini、GPT 或 Claude),并调整响应的温度和令牌使用限制。
- 语音、延迟、稳定性调整: 用户可以调整语音、延迟、稳定性、认证标准和与 AI 代理对话的最大长度等参数。
- 知识库集成: 用户可以添加自己的知识库,如文件、URL 或文本块,以支持对话机器人,并集成自定义 LLM。
- SDK 和 WebSocket API: ElevenLabs 的 SDK 兼容 Python、JavaScript、React 和 Swift,同时提供 WebSocket API 以实现更多定制。
- 数据收集与评估标准: 公司可以定义标准来收集数据项(如客户姓名和电子邮件)以及自然语言的评估标准。
市场竞争与未来展望:
ElevenLabs 正在利用其现有的文本转语音管道,并为新的对话式 AI 产品开发语音转文本功能。虽然目前未将语音转文本 API 作为独立产品提供,但未来可能会成为谷歌、微软、亚马逊以及 OpenAI 的 Whisper 等专业 API 的竞争对手。
该公司正寻求以超过 30 亿美元的估值筹集新资金,并与其他语音 AI 初创公司竞争,如 Vapi 和 Retell。ElevenLabs 认为其定制能力和切换模型的能力将使其在竞争中占据优势,特别是在与 OpenAI 的实时对话 API 竞争时。
相关文章
相关文章
正文完
关注公众号获取最新教程

发表至: AI语音
2024-11-19