共计 1474 个字符,预计需要花费 4 分钟才能阅读完成。
纽约南区法院驳回了一起由左倾在线新闻网站 Raw Story Media, Inc. 和 AlterNet Media, Inc. 提起的版权侵权诉讼。这两家公司指控 OpenAI 在训练其 AI 模型(如 ChatGPT)时使用了未经授权的新闻内容,从而侵犯了版权。这一驳回被认为是版权与 AI 工具之间持续斗争中的一个重要时刻,尤其是在《数字千年版权法》(DMCA)第 1202(b)条下的应用。(地址)
DMCA 第 1202(b)条
- 版权管理信息(CMI):DMCA 第 1202(b)条旨在保护“版权管理信息”(CMI),包括作者姓名、标题和其他标识版权作品的元数据。
- 禁止行为:该条款禁止未经授权删除或更改此类信息,特别是如果这样做有助于版权侵权。
原告的指控
- 指控内容 :Raw Story 和 AlterNet 指控 OpenAI 在训练 ChatGPT 和其他模型时使用了他们网站上的文章,但没有保留 CMI,从而违反了第 1202(b) 条。
- 数据抓取:OpenAI 并不是唯一可能从网络上抓取此类材料的 AI 公司。整个行业已经抓取了大量网络数据来训练其模型,这种做法类似于 Google 在搜索引擎中爬取和索引网页内容。
法院驳回的理由
- 缺乏诉讼资格:法官 Colleen McMahon 批准了 OpenAI 驳回此案的动议,理由是原告缺乏诉讼资格。具体来说,法官发现原告无法证明他们因 OpenAI 的行为遭受了具体的、实际的伤害,这是美国宪法第三条对任何诉讼进行的基本要求。
- 生成式 AI 的特性:法官还考虑了大型语言模型(LLM)接口不断变化的格局,指出这些系统的更新进一步复杂化了归属和可追溯性。生成式 AI 旨在综合信息,而不是逐字复制,这使得原告的指控更加推测性。
- 具体证据不足:法官指出,“ChatGPT 输出原告文章中抄袭内容的可能性似乎很小。”原告未能提供令人信服的证据,证明他们的特定作品以导致可识别损害的方式直接侵权。
类似案例
- Doe 1 v. GitHub:涉及微软 Copilot 的案件也涉及第 1202(b)条的索赔。法院发现 Copilot 生成的代码并非原始代码的“完全相同复制”,而是重新配置的片段,这使得证明违反 CMI 要求变得困难。
- Sarah Silverman 案:法院认为原告未能提供足够证据证明 OpenAI 主动移除了她的内容的 CMI。这一裁决与 Raw Story 的裁决一致,突显了原告面临的举证负担。
第 1202(b)条的分歧
- 相同性要求:一些法院施加了所谓的“相同性”要求,即原告必须证明侵权作品是原始内容的完全复制,减去 CMI。
- 灵活解释:其他法院则允许更灵活的解释,例如德克萨斯州南区法院最近拒绝了相同性要求,指出即使部分复制也可能构成侵权,如果 CMI 被故意移除。
对 AI 和内容创作者的意义
- 法律先例:Raw Story 诉讼的驳回不仅仅是 OpenAI 的胜利,还表明了法院在快速发展的生成式 AI 领域如何处理类似的版权索赔。这一裁决可能有助于确立驳回此类及未来索赔的先例。
- 证明损害的难度:如果没有明确的、可证明的伤害或完全复制,原告可能难以在法庭上获得胜诉。
- 综合数据 vs. 直接复制:生成式 AI 如何综合数据而不是直接复制数据,使得在现行版权法下证明侵权变得困难。
- 透明度和合规性:对于开发者和科技公司来说,透明度、数据记录和合规性是避免法律麻烦的关键。与内容创作者达成许可协议可能成为新的标准。
Raw Story 诉讼的驳回反映了法院在处理生成式 AI 和版权问题时面临的挑战。随着技术的不断发展,法律界也在努力适应新的现实。对于内容创作者来说,确保适当的归属和防止未经授权使用其作品仍然是一个重大挑战,而透明和合规的实践将有助于减少法律风险。
正文完
关注公众号获取最新教程
发表至: AI宝典
2024-11-08