AI基准测试组织因隐瞒来自OpenAI的资助而受到批评

文章目录[隐藏]

背景介绍
社区反应
Epoch AI回应

一家专注于开发用于评估AI数学能力基准的非营利组织Epoch AI，由于直到最近才公开其接受了来自OpenAI的资金支持，而在AI社区内引发了争议。

背景介绍

Epoch AI主要由Open Philanthropy（一个研究和赠款基金会）资助，致力于开发名为FrontierMath的测试工具。此工具包含专家级别的问题，旨在衡量AI系统的数学技能，并被OpenAI选为展示其即将推出的旗舰模型o3性能的基准之一。然而，在最初发布时，Epoch AI并未完全透明地公开OpenAI对其的支持情况。

社区反应

在LessWrong论坛上，一位名为“Meemi”的Epoch AI承包商指出，许多参与FrontierMath开发的人是在项目公开后才得知OpenAI的参与。“关于这一点的沟通是不透明的，”Meemi写道，“在我看来，Epoch AI应当提前披露OpenAI的资助，确保承包商能够基于充分的信息决定是否参与。”

社交媒体上的讨论进一步揭示了这种保密性可能损害FrontierMath作为公正评估标准声誉的担忧。此外，斯坦福大学数学博士生Carina Hong提到，一些贡献者对OpenAI拥有对FrontierMath的特权访问权感到不满，并表示如果早知此事，他们可能会重新考虑自己的参与。

Epoch AI回应

面对批评，Epoch AI副主任兼联合创始人Tamay Besiroglu承认组织在透明度方面存在不足：“我们确实犯了一个错误，没有更早地向贡献者提供完全透明的信息。”Besiroglu解释说，尽管出于合同限制未能立即公开合作伙伴关系，但事后看来，他们应该更加努力争取尽早实现信息透明化。

Besiroglu还强调，虽然OpenAI可以获得FrontierMath的数据，但双方达成了口头协议，即OpenAI不会利用这些数据来训练其AI系统。为了保证结果的客观性，Epoch AI还保留了一个独立的验证集，用以进行额外的结果核实。（来源）

AI PC装机指南