微软与 OpenAI要调查 DeepSeek 是否使用窃取数据进行训练

DeepSeek 作为 AI 领域的新竞争者,凭借其高效的数据处理能力和低成本的模型训练迅速崛起,引发了美国市场的广泛关注。然而,这种快速崛起也引发了对数据隐私和知识产权的担忧。据彭博社报道,微软和 OpenAI 正在调查 DeepSeek 是否不当访问了 OpenAI 的数据。

调查背景

微软的安全研究人员在 2024 年底发现了异常活动,怀疑与 DeepSeek 有关联的开发者账户通过 OpenAI 的 API 泄露了大量数据。尽管开发者可以使用 OpenAI 的 API 将其模型集成到自己的应用程序中,但这种提炼输出的行为违反了 OpenAI 的使用政策。

特朗普人工智能沙皇的指控

美国总统唐纳德·特朗普的人工智能沙皇大卫·萨克斯在接受福克斯新闻采访时表示,有大量证据表明 DeepSeek 学习了 OpenAI 模型的输出,以帮助其以低廉的成本开发自己的技术。萨克斯解释了“提炼”技术的原理:一个模型通过向另一个模型提出大量问题,模仿其推理过程,从而学习并复制其功能。

萨克斯指出:“有大量证据表明,DeepSeek 从 OpenAI 模型中提炼知识,我认为 OpenAI 对此并不高兴。”

OpenAI 的回应

OpenAI 根据萨克斯的指控向福克斯新闻发表了一份声明,强调其采取了多种对策来保护知识产权,并与美国政府密切合作,以防止技术被窃取。声明中提到:“我们知道,总部位于中华人民共和国的公司以及其他公司不断试图提炼美国领先人工智能公司的模型。作为领先的人工智能构建商,我们采取对策来保护我们的知识产权,并相信随着我们前进,与美国政府密切合作以保护最强大的模型至关重要。”

行业反应

  • 萨姆·奥特曼:OpenAI 的首席执行官萨姆·奥特曼此前曾回应 DeepSeek 发布其 R1 推理模型,称其“令人印象深刻”,并表示他欢迎竞争。
  • 特朗普总统:特朗普在佛罗里达州的一次静修会上告诉众议院共和党人,DeepSeek 的发布应该给美国公司敲响“警钟”,并强调需要集中精力竞争并获胜。