【2023年12月28日AI晚报】SuperCLUE发布中文大模型基准测评年度报告;《纽约时报》起诉OpenAI和微软侵权

228次阅读
没有评论

共计 2803 个字符,预计需要花费 8 分钟才能阅读完成。

AI·快讯

1、深度势能发布预训练大模型 DPA-2

据深度势能微信公众号昨日发文,深度势能团队近日面向社区发布了预训练大模型 DPA-2。基于 DPA- 2 的微调 / 蒸馏 / 应用自动化流程也于同期面向社区全面开放,相关论文在 arXiv 上预发表。据介绍,相比于去年发布的 DPA-1,DPA- 2 在模型架构显著更新的同时,最大的特点在于采用了多任务训练的策略,从而可以同时学习计算设置不同、标签类型不同的各类数据集,由此产生的模型在下游任务上显示出极强的少样本乃至零样本迁移的能力。目前用于训练 DPA- 2 模型的数据集已覆盖了半导体、钙钛矿、合金、表面催化、正极材料、固态电解质、有机分子等多类体系。(来源

论文地址:arxiv.org/abs/2312.15492

Notebook 链接:nb.bohrium.dp.tech/detail/18475433825

2、澜舟科技通过生成式 AI 备案并发布两款大模型

据澜舟科技微信公众号发文,12 月 26 日,澜舟科技正式通过国家互联网信息办公室颁布的《生成式人工智能服务管理暂行办法》备案,将很快向公众发布孟子大模型及其核心能力。同时,澜舟科技正式发布孟子 GPT- 金融 -13B 大模型和澜舟的第一款代码助手大模型:孟子 GPT-Code-6.7B 大模型。据介绍,孟子 GPT- 金融 -13B 行业大模型能够精准理解和解答用户在金融市场、投资理财等相关主题的问题,同时也能编写各种金融分析文章、研究报告,以及完成各类金融信息的深度加工等任务。孟子 GPT-Code-6.7B 大模型基于开源模型 DeepSeek Coder 开发,引入了金融行业的数据进行预训练,并使用高质量的任务数据进行了微调,支持中英文两种语言,并兼容 100 多种编程语言。(来源

孟子 GPT- 金融 -13B 大模型体验链接:langboat.com/product/mchat?model=mengzi-gpt-fin-13b

孟子 GPT-Code-6.7B 大模型体验链接:langboat.com/product/mchat?model=mengzi-gpt-code

3、韩国明确 AI 生成内容不受版权保护

据韩国联合通讯社报道,昨日,韩国文化部宣布将不对 AI 生成的内容进行版权登记,从法律上不承认此类内容的创造性。文化部补充说,只有那些明显传达人类思想和情感的作品才有可能进行版权登记。这一决定将很快在面向 AI 企业、版权持有者和用户的“AI 版权指南”中公布,指南还规定,AI 企业需要向版权持有者提供公平的补偿,以确保其产品的使用权,建议版权持有者明确表达其意图或采取技术措施,以防止其创作被用于 AI 研究。(来源

4、《纽约时报》起诉 OpenAI 和微软侵权

据《纽约时报》报道,当地时间周三,《纽约时报》起诉 OpenAI 和微软侵权,指控其数百万篇文章被 OpenAI 用于训练 AI 聊天机器人,而这些机器人现在正作为可靠信息来源与该新闻机构竞争。诉讼称,被告应承担与“非法复制和使用《纽约时报》独特价值作品”相关的“数十亿美元的法定和实际损失”,并要求这两家公司销毁任何使用《纽约时报》版权材料的聊天机器人模型和训练数据。(来源

5、优酷上线对话式影视搜索工具“AI 搜片”:可模糊搜索 / 询问影片剧情

优酷视频今天宣布上线一项新功能“AI 搜片”,号称是全网首个 AI 对话类影视搜索引擎。据介绍,该功能号称覆盖全网百万级影视剧实体信息,融合万亿条文娱相关知识词条,可通过多轮对话来实现模糊搜索、影视问答、剧情检索等功能,不需要具象化的问题就能完成。官方还表示,该功能不仅可以通过模糊、口语化的提问获取精准匹配的影视信息,还能和 AI 交流全网影视知识。(来源

6、GPT“生成式钓鱼邮件”泛滥,研究人员建议“使用 AI 对付 AI”

安全公司 Abnormal 日前发布报告,声称如今“AI 钓鱼邮件”愈发泛滥,许多黑客利用各种模型批量创建钓鱼邮件,之后使用脚本群发相关邮件,从而实施“高效率”网络诈骗活动。该公司研究人员举例 WormGPT、FraudGPT 等“专为网络犯罪而生”的恶意 AI 工具,声称当下黑客已经将生成式 AI 融入到攻击策略中,因此用户也需要“以相同的方式做出反击”,利用 AI 过滤“可能由 AI 创建的钓鱼邮件”。(来源

7、Meta 首席科学家杨立昆:OpenAI 已沦为微软的“合同研究机构”

Meta 首席 AI 科学家杨立昆(Yann LeCun)日前接受《连线》杂志采访,对萨姆・阿尔特曼掌舵的 OpenAI 进行了猛烈抨击。杨立昆直言,OpenAI 已偏离了最初设定的非盈利道路,且沦为了微软的“合同研究机构”。“现在,他们基本上是微软的合同研究机构,尽管他们有一定的独立性。”(来源

8、雷鸟 X2 上线自研大模型语音助手 RayNeo AI

近日,雷鸟自研大模型语音助手 Rayneo AI 已经在雷鸟 X2 内测上线,Rayneo AI 在传统语音助手功能的基础上,进一步加入了多轮自然语言对话、行程规划、便捷百科问答、头脑风暴等多项能力。

9、百度飞桨文心生态成果最新披露:开发者达 1070 万,模型数超 86 万

由深度学习技术及应用国家工程研究中心主办的 WAVE SUMMIT+ 深度学习开发者大会 2023 在北京召开。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰现场公布了飞桨文心五载十届最新生态成果,文心一言最新用户规模破 1 亿,截至 12 月底,飞桨平台开发者数量达 1070 万。

10、蚂蚁集团开源首个医疗专科推理数据集,覆盖 97.6% 泌尿就医人群

蚂蚁集团今日宣布开源首个医疗专科推理数据集。该数据集由训练、验证、测试三部分组成,包含 2132 个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了 97.6% 以上的泌尿科就医人群 ,号称能“真实复刻诊疗场景”。( 来源

GitHub 地址:https://github.com/alipay/RJU_Ant_QA

11、SuperCLUE 发布中文大模型基准测评年度报告

中文大模型测评基准 SuperCLUE 发布《中文大模型基准测评 2023 年度报告》,通过多维度综合性测评,对国内外大模型发展现状进行观察与思考。报告包括国内大模型关键进展、测评体系、方法说明、大模型综合测评结果、SuperCLUE2.0 升级、四大维度测评分析及示例介绍以及优秀模型案例介绍等内容。(来源

12、MiniMax 将发布国内首个 MoE 大模型

中国大模型创业企业 MiniMax 副总裁魏伟在数字中国论坛成立大会暨数字化发展论坛的一场分论坛上透露称,将于近期发布国内首个基于 MoE(Mixture-of-Experts)架构的大模型,对标 OpenAI GPT-4。MoE 全称专家混合,是一种深度学习技术,它通过将多个模型直接结合在一起,以加快模型训练的速度,获得更好的预测性能。

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-12-28发表,共计2803字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。