OpenAI OpenAI推出MLE-bench:评估AI代理在机器学习工程中的能力 机器学习(ML)模型在各种编码任务中显示出有希望的结果,但在有效基准测试 AI 代理在 ML 工程中的能力方面...