AI PC装机指南

DeepL推出语音翻译服务：DeepL Voice

2024年11月13日

/

文章目录[隐藏]

主要功能
- 1. 支持的语言
- 2. 实时翻译
应用场景
- 1. 视频会议
- 2. 服务行业
技术优势
- 1. 实时性能
- 2. 自主开发
数据保护
- 数据传输
未来展望
- 1. 更多语音产品
- 2. 功能扩展

DeepL是一家以其在线文本翻译服务而闻名的德国初创公司，以其翻译的微妙和精确性著称，估值已达20亿美元，并拥有超过10万名付费客户。随着AI服务的持续增长，DeepL在其平台上增加了一种新的模式：音频。用户现在可以使用DeepL Voice来听某人用一种语言说话，并实时自动将其翻译成另一种语言。

地址：https://www.deepl.com/zh/products/voice

主要功能

1. 支持的语言

输入语言：DeepL Voice目前可以“听懂”英语、德语、日语、韩语、瑞典语、荷兰语、法语、土耳其语、波兰语、葡萄牙语、俄语、西班牙语和意大利语。
输出语言：翻译字幕可用于DeepL翻译器目前支持的所有33种语言。

2. 实时翻译

现场对话：DeepL Voice旨在实时、现场对话和视频会议中使用，以文本形式呈现翻译结果，而非音频。
显示方式：用户可以设置翻译在智能手机上以“镜像”形式显示，将手机放在会议桌中间，以便双方都能看到翻译的文字，或者作为与某人并排共享的转录文本。
视频会议：视频会议服务将翻译显示为字幕。

应用场景

1. 视频会议

Teams集成：目前唯一支持DeepL字幕的视频通话服务是Microsoft Teams。DeepL的创始人兼CEO Jarek Kutylowski表示，这“覆盖了大多数客户”。
其他平台：关于Zoom或Google Meet是否会整合DeepL Voice，目前尚无消息。

2. 服务行业

前线工作人员：DeepL Voice的一个主要用例是在服务行业，例如餐厅的前线工作人员可以使用该服务更轻松地与顾客沟通。

技术优势

1. 实时性能

低延迟：DeepL Voice的独特卖点之一是其低延迟的实时翻译能力，这在市场上许多“AI翻译”服务存在延迟的情况下显得尤为重要。

2. 自主开发

从零开始构建：与许多依赖并调整其他公司大型语言模型（LLMs）的AI应用不同，DeepL的目标是从零开始构建其服务。今年7月，公司发布了一款针对翻译优化的全新LLM，声称其性能优于GPT-4以及谷歌和微软的模型。

数据保护

数据传输

服务器处理：语音数据将被传输到DeepL的服务器进行翻译，处理不在设备上进行。
隐私保护：Kutylowski坚称，系统不会保留任何内容，也不会用于训练其LLMs。公司还将与客户合作，确保他们不违反GDPR或其他数据保护法规。

未来展望

1. 更多语音产品

语音是未来：Kutylowski表示，语音是未来一年翻译将发挥作用的地方，暗示DeepL的首款语音产品DeepL Voice可能只是第一步，未来可能会有更多的语音相关产品推出。

2. 功能扩展

音频和视频输出：尽管目前DeepL Voice仅提供文本翻译，但Kutylowski暗示未来可能会增加音频和视频输出功能。
API和集成：目前还没有针对语音产品的API，但DeepL正在直接与合作伙伴和客户合作，未来可能会提供更多集成选项。

相关文章