【2023年9月4日AI晚报】Meta 发布122 种语言的机器阅读理解数据集Belebele;腾讯混元大模型或于 9 月初生态大会上亮相

265次阅读
没有评论

共计 2178 个字符,预计需要花费 6 分钟才能阅读完成。

AI·快讯

1、Meta 发布 122 种语言的机器阅读理解数据集

9 月 2 日,Meta 于旗下社交媒体 Threads 上发布了涵盖 122 种语言变体的多项选择机器阅读理解(MRC)数据集 Belebele。该数据集可以评估高、中、低资源语言的单语言和多语言模型。每个问题有四个多选答案,并与 FLORES-200 数据集中的一个短文段相连。由于该数据集是完全并行的,因此可以直接比较所有语言的模型性能。

数据集地址:https://github.com/facebookresearch/belebele

论文地址:https://arxiv.org/abs/2308.16884

【2023 年 9 月 4 日 AI 晚报】Meta 发布 122 种语言的机器阅读理解数据集 Belebele;腾讯混元大模型或于 9 月初生态大会上亮相

2、Llama 2 全流程解决方案开源 训练增速 195%

今日,大模型开发工具社区 Colossal-AI 开源发布为 8 至 512 个 GPU 提供的 Llama 2 训练、微调、推理方案,对 700 亿参数训练加速 195%,并提供一站式云平台解决方案。

开源地址:https: //github.com/hpcaitech/ColossalAI

【2023 年 9 月 4 日 AI 晚报】Meta 发布 122 种语言的机器阅读理解数据集 Belebele;腾讯混元大模型或于 9 月初生态大会上亮相

3、腾讯混元大模型或于 9 月初生态大会上亮相

据中国证券报报道,8 月 31 日,证券报记者从腾讯方面获悉,腾讯将在 9 月初举行的 2023 年腾讯全球数字生态大会上正式发布混元大模型,但并未提及是否面向公众开放。腾讯此前表示,腾讯混元大模型已经进入公司内部应用测试阶段,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档等多个腾讯内部业务和产品,已经接入腾讯混元大模型测试并取得初步效果。

4、作业帮发布教育领域银河大模型

据作业帮微信公众号发文,9 月 2 日,作业帮在 2023 中国国际服务贸易交易会上正式发布自研银河大模型。该模型融合了作业帮多年的 AI 算法和教育数据积累,是一款覆盖多学科、多学段、多场景的教育大模型,具备多学科知识解答、创意写作、自主提问、陪伴式辅导等功能。在测评基准上,该模型以平均分 73.7 分居 C -Eval 榜首,同时在 CMMLU 榜单 Five-shot 和 Zero-shot 测评中分别以平均分 74.03 分及 73.85 分位列第一。

5、首个中英语音 LLM 开源 李开复零一万物参与

8 月 30 日,LinkSoul.AI、北京大学和零一万物合作发表论文,提出了一个中英双语的对话模型 LLaSM,同时支持录音和文本输入,并开源可商用。论文认为,“语音聊天”才是 AI 与人之间更方便自然的交互方式,而不仅仅是通过文本输入。该论文的共同一作 Yu Shu 和 Siwei Dong 均来自 LinkSoul.AI,此前曾经在北京智源人工智能研究院工作。LinkSoul.AI 是一家 AI 初创公司,之前推出过首个开源 Llama 2 的中文语言大模型。

论文地址:https://arxiv.org/abs/2308.15930

Demo 地址:https://huggingface.co/LinkSoul/LLaSM-Cllama2

【2023 年 9 月 4 日 AI 晚报】Meta 发布 122 种语言的机器阅读理解数据集 Belebele;腾讯混元大模型或于 9 月初生态大会上亮相

6、艾伦 AI 研究所推出生成式 AI 地图工具 Satlas

8 月 31 日,艾伦人工智能研究所推出关于可再生能源项目与树木覆盖率的地图工具 Satlas。该工具基于欧洲航天局 Sentinel- 2 卫星图像,使用深度学习模型来填充建筑物的外观等细节,以生成高分辨率图像。

Satlas 地址:https://satlas.allen.ai

【2023 年 9 月 4 日 AI 晚报】Meta 发布 122 种语言的机器阅读理解数据集 Belebele;腾讯混元大模型或于 9 月初生态大会上亮相

7、Steam 清退包含 ChatGPT 模组的游戏

9 月 2 日,Reddit 帖主 Shasaur 发帖称,他花了三年半的时间和积蓄开发的游戏被 Steam 拒绝并下架了,原因是数月前,他在游戏测试版中加入了一个可选的 ChatGPT 模组,让玩家可以用 ChatGPT 的回复来替换 NPC 的对话。在游戏被清退时,他收到官方的邮件,回复称“您的游戏包含人工智能”。(来源:IT 之家

8、三星电子明年将在家电引入基于 Bixby 的生成式 AI

三星电子家用电器部门副总裁 Miyoung Yu 在 IFA 2023 展会上宣布,三星电子明年将在所有家用电器中引入基于 Bixby 的生成式 AI 功能。柳副社长预计,家电将通过人工智能的扩展,实现基本性能以外的服务,如空调会自动设置用户喜欢的温度,冰箱不仅可以储存食材,还可以确定状况并提出管理建议。(来源:IT 之家

9、哈佛大学文理学院将 ChatGPT 等生成式 AI 工具引入课堂,并发布使用指南

哈佛大学旗下网站 Harvard Crimson 9 月 1 日公告,该校文理学院首次发布了教授在课程中使用 ChatGPT 等生成式 AI 的指南。该指南由哈佛大学本科教育办公室发布,提供了关于生成式 AI 的工作原理及其前在学术应用的一系列信息,其重点与先前发布的全校 AI 使用指南相比,更加侧重于保护非公开数据。此外,哈佛大学文理学院要求,教师不要将学生作业输入到 AI 系统内,以免数据被第三方收集用于 AI 训练。(来源:IT 之家

10、ChatGPT 上线 Canva 插件,可生成图片和视频内容

ChatGPT Plus 订阅服务中推出了一个独特的 Canva 插件,可以让用户快速方便地生成设计、表格、图形、图片和短视频等视觉内容。用户只需输入文字,ChatGPT 就会利用 Canva 的丰富多样的模板,将文字转换成个性化的视觉模板。IT 之家注意到,这个功能不同于其他的文字转图片生成器,其并不是从零开始制作图片,而是利用 Canva 已有的模板进行定制。(来源:IT 之家

【2023 年 9 月 4 日 AI 晚报】Meta 发布 122 种语言的机器阅读理解数据集 Belebele;腾讯混元大模型或于 9 月初生态大会上亮相

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-09-04发表,共计2178字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。