共计 1190 个字符,预计需要花费 3 分钟才能阅读完成。
DeepL 是一家以其在线文本翻译服务而闻名的德国初创公司,以其翻译的微妙和精确性著称,估值已达 20 亿美元,并拥有超过 10 万名付费客户。随着 AI 服务的持续增长,DeepL 在其平台上增加了一种新的模式:音频。用户现在可以使用 DeepL Voice 来听某人用一种语言说话,并实时自动将其翻译成另一种语言。
主要功能
1. 支持的语言
- 输入语言:DeepL Voice 目前可以“听懂”英语、德语、日语、韩语、瑞典语、荷兰语、法语、土耳其语、波兰语、葡萄牙语、俄语、西班牙语和意大利语。
- 输出语言:翻译字幕可用于 DeepL 翻译器目前支持的所有 33 种语言。
2. 实时翻译
- 现场对话:DeepL Voice 旨在实时、现场对话和视频会议中使用,以文本形式呈现翻译结果,而非音频。
- 显示方式:用户可以设置翻译在智能手机上以“镜像”形式显示,将手机放在会议桌中间,以便双方都能看到翻译的文字,或者作为与某人并排共享的转录文本。
- 视频会议:视频会议服务将翻译显示为字幕。
应用场景
1. 视频会议
- Teams 集成:目前唯一支持 DeepL 字幕的视频通话服务是 Microsoft Teams。DeepL 的创始人兼 CEO Jarek Kutylowski 表示,这“覆盖了大多数客户”。
- 其他平台:关于 Zoom 或 Google Meet 是否会整合 DeepL Voice,目前尚无消息。
2. 服务行业
- 前线工作人员:DeepL Voice 的一个主要用例是在服务行业,例如餐厅的前线工作人员可以使用该服务更轻松地与顾客沟通。
技术优势
1. 实时性能
- 低延迟:DeepL Voice 的独特卖点之一是其低延迟的实时翻译能力,这在市场上许多“AI 翻译”服务存在延迟的情况下显得尤为重要。
2. 自主开发
- 从零开始构建:与许多依赖并调整其他公司大型语言模型(LLMs)的 AI 应用不同,DeepL 的目标是从零开始构建其服务。今年 7 月,公司发布了一款针对翻译优化的全新 LLM,声称其性能优于 GPT- 4 以及谷歌和微软的模型。
数据保护
数据传输
- 服务器处理:语音数据将被传输到 DeepL 的服务器进行翻译,处理不在设备上进行。
- 隐私保护:Kutylowski 坚称,系统不会保留任何内容,也不会用于训练其 LLMs。公司还将与客户合作,确保他们不违反 GDPR 或其他数据保护法规。
未来展望
1. 更多语音产品
- 语音是未来:Kutylowski 表示,语音是未来一年翻译将发挥作用的地方,暗示 DeepL 的首款语音产品 DeepL Voice 可能只是第一步,未来可能会有更多的语音相关产品推出。
2. 功能扩展
- 音频和视频输出:尽管目前 DeepL Voice 仅提供文本翻译,但 Kutylowski 暗示未来可能会增加音频和视频输出功能。
- API 和集成:目前还没有针对语音产品的 API,但 DeepL 正在直接与合作伙伴和客户合作,未来可能会提供更多集成选项。
相关文章
相关文章
正文完
关注公众号获取最新教程

发表至: AI语音
2024-11-13