【2023年6月25日AI晚报】谷歌推出一款能说会听的大语言模型AudioPaLM；AI 作画工具 Midjourney 迎来 5.2 版本更新

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]
[t-success icon='']AI·新创[/t-success]

[t-success icon='']AI·快讯[/t-success]

1、亚马迅云推出生成式AI创新中心

据亚马逊消息，亚马逊将投资1亿美元，推出全新 AI 项目AWS生成式AI创新中心。据悉，该项目将AWS附属的数据科学家、策略师、工程师和解决方案设计师同客户及合作伙伴联系起来，帮助企业客户运用生成式AI技术，加快他们创新和成功的速度。亚马逊表示，该项目目前已在和两家客户Highspot和Twilio合作。

2、报告称 5 月美国生成式 AI 岗位激增 20%

根据招聘求职网站 Indeed 公布的最新数据，今年 5 月美国生成式 AI 相关的职位数量环比增加了 20%，表明越来越多的美国企业希望搭上风口，布局或者利用该技术，推动企业发展。5 月数据显示，美国每百万岗位招聘信息中有 204 个生成式 AI 相关岗位，是 2021 年的 2 倍多。在 Indeed 的人工智能岗位中，数据科学家职位占比 5%、软件工程师、机器学习工程师和数据工程师等职位也很受企业欢迎。

3、AI 入局世界网球温布顿锦标赛，可分析赢球概率及生成球评

在去年 12 月举行的卡塔尔世界杯中，AI 已经崭露头角，裁判使用 AI 配合检测器，对球员进行越位判决。而今年更多体育竞赛将引入 AI，以提升球场工作人员效率。全英草地网球俱乐部和 IBM 近日宣布，即将在 7 月 3 日到 7 月 16 日开打的世界网球四大公开赛之一的温布顿（Wimbledon）网球锦标赛，将采用以 AI 技术提供球评及球员赢球几率预测分析。（来源：IT之家）

4、AI 公司MosaicML推出300亿参数模型MPT-30B，表示训练成本仅为竞品零头

AI创业公司MosaicML近日发布了其语言模型MPT-30B，该模型具有300亿参数，训练成本“仅有其他同类竞品模型的零头”，有望促进行业逐步降低此类模型训练成本，扩大AI模型在更广泛领域的运用。MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示，MPT-30B 的训练成本为 70 万美元（约 502.44 万元人民币），远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外，由于 MPT-30B 的成本较低，体积较小，它也可以更快速地被训练，并且更适合部署在本地硬件上。MosaicML 公司表示，将模型扩展到 300 亿参数只是第一步，接下来他们将以降低成本为前提，推出体积更大、质量更高的模型。（来源：IT之家）

地址：https://huggingface.co/mosaicml/mpt-30b

5、美国商务部宣布成立 AI 公共工作组，应对生成式人工智能潜在风险

美国商务部部长吉娜・雷蒙多（Gina Raimondo）日前宣布，美国国家标准与技术研究院（NIST）将成立一个新的人工智能（AI）公共工作组，该工作组将在 NIST 人工智能风险管理框架（RMF）的成功基础上，进一步解决 AI 技术快速发展带来的问题。美国商务部表示，该工作组将招募来自私营和公共部门的志愿者与技术专家，并将重点关注与生成式 AI 相关的风险，因为生成式 AI 正在推动技术和市场的快速变化。

NIST 为工作组制定了短期、中期和长期目标。短期内，该工作组将提供指导意见，向外界介绍如何使用 NISF 的 AI 风险管理框架来支持生成式 AI 研发。中期来看，该工作组将支持 NIST 在生成式 AI 相关的测试、评估等方面的工作。长期来看，该工作组将探索有效利用生成式 AI 来解决社会问题的可能性，例如健康、环境和气候变化等议题。

6、Dropbox 测试 AI 搜索工具 Dropbox Dash

Dropbox 近日发布 AI 搜索工具 Dropbox Dash，帮助提高工作效率，简化工作流程。Dropbox Dash 拥有 AI 驱动的搜索功能，将多个办公平台和应用聚合在一起，提高用户的搜索效率。他可以让用户在搜索栏中快速找到自己所需要的信息。 Dropbox Dash 还具备堆栈功能，可以帮助用户快速存储和整理相关地址。据悉， Dropbox Dash 将会在未来引入生成式对答功能，根据用户提问进行回答。目前 Dropbox Dash 正在进行小范围测试，上线时间尚不确定。（来源：IT之家）

7、谷歌推出 AudioPaLM，一款能说会听的大语言模型

据 huggingface 页面显示，谷歌研究团队近日推出一款大语言模型产品 AudioPaLM，可以实现语音理解和生成功能。AudioPaLM 将两个大语言模型 PaLM-2 和 AudioLM 融合到一个统一的多模态架构之中，利用该架构处理和生成文本和语音。 AudioPaLM 还支持语音识别以及语音翻译。试验表明，AudioPaLM 的表现显著优于现有的语音翻译系统。

地址：https://huggingface.co/papers/2306.12925

8、掌趣科技与悠米达成合作，将共同开发AI游戏创作平台

掌趣科技近日宣布与悠米达成战略合作。据悉，双方将共同开发“AI游戏创作平台”，降低开放世界游戏的开发门槛，实现个人及小团队也可以开发大规模的开放世界游戏，并通过该平台分享游戏成果。据悉，掌趣科技将基于自身在游戏及AI技术、产品、运营、渠道等方面的优势，结合悠米在3A开放世界、万人同时在线交互、高精度物理仿真、数字人及虚拟现实场景编辑等领域的技术储备，实现在游戏创作和游戏体验方面的AI化提升，打造“AI+UGC”平台。

9、视频生成模型 zeroscope_v2 XL 开源

据huggingface 页面显示，一款名为zeroscope_v2 XL 的视频生成模型现已开源。zeroscope_v2 XL 基于 Modelscope 打造，可以通过文本生成 16:9 的高质量视频。据悉，zeroscope_v2 XL 采用 24 帧、576x320 分辨率的 9923 个剪辑和 29769 个标记帧进行训练。

地址：https://huggingface.co/cerspense/zeroscope_v2_XL

10、Stable Diffusion 版本更新，生成图片更加真实

Stability AI近日宣布，推出 SDXL 0.9 版本更新，对 Stable Diffusion 文本生成图片模型进行了升级。升级之后的 Stable Diffusion 可以呈现更加逼真的图片效果，而且图像和构图细节也得以改进。Stability AI 表示用户可以通过 ClipDrop 访问该模型，即将推出相关的 API，预计会在今年 7 月中旬发布的 1.0 版本。（来源）

11、OpenAI首席执行官表态支持欧盟AI监管

欧盟产业主管埃里·布雷顿在美国加州会见Meta公司首席执行官扎克伯格和OpenAI首席执行官奥特曼等人。布雷顿表示，他和扎克伯格在欧盟的人工智能监管问题上“意见一致”，目前正在进行最后的谈判。布雷顿说，他们就水印等措施达成了一致。OpenAI首席执行官奥特曼说，他也同意欧盟在人工智能方面的做法，并补充说：“我真的很感谢欧洲的机构在这里，以及对这个问题如此认真对待的远见，对世界其他地区也是如此。”

12、YouTube 将推出AI配音功能，支持多种语言配音

YouTube 近日宣布与Aloud 合作，推出全新的 AI 语音功能，该功能目前正在测试之中，计划在2024年上线。据悉，这项功能可以帮助创作者为视频自动配音，并将配音翻译为其他的语言。AI 会先将原本的内容转换成文字并进行翻译，之后会由 AI 根据翻译后的语言生成相应的配音。YouTube相信，为视频配备不同语言的配音可以吸引更多的观众收看。

13、AI 作画工具 Midjourney 迎来 5.2 版本更新，可生成相机“变焦效果”

AI 作画工具 Midjourney 日前更新了 5.2 版本，主要带来了“Zoom out”功能，可以模拟相机的“超广角、中长焦”效果，为图像添加不同焦段下的透视细节。据悉，Midjourney 5.2 版本为“Zoom out”功能带来了三种不同风格的变焦模拟，提供了三种缩放选择，分别是原始图像“镜头焦距”的 0.5、1.5 倍、2 倍效果。即原图（1.0 倍变焦）采用 50mm 焦距，则可以生成介于 28-35mm、75mm、100mm 的透视效果。（来源：IT之家）

14、日本起草针对学校的生成式 AI 使用指南，禁止学生用 ChatGPT 写作文

据《读卖新闻》报道，日本文部科学省近日表示，已经针对以 ChatGPT 为代表的生成式 AI，起草了面向学校的指导方针，并将在听取专家意见后尽快发布。该草案指出，生成式 AI 带来版权侵权、虚假信息传播等各种风险，因此面向学校率先尝试 “对生成式 AI 有限制的使用是适当的”。在此基础上，草案提出了关于学校使用生成式 AI 的具体“不当”案例，包括在诗歌、俳句等文学创作活动中使用生成式 AI，或在考试中使用。（来源：IT之家）

15、知名AI研究员德夫林短暂跳槽OpenAI后重回谷歌

据The Information报道，知名人工智能研究员雅各布·德夫林（Jacob Devlin）已重返原来的工作岗位。今年1月，德夫林在内部抱怨谷歌如何培训其聊天机器人软件Bard AI后，离开谷歌，加入竞争对手OpenAI。

[t-success icon='']AI·新创[/t-success]

1、IGT Solutions 推出企业级生成式人工智能平台 TechBud.AI

IGT Solutions 推出了企业级生成式人工智能平台TechBud.AI。通过企业级生成式人工智能的无缝运用，这款先进的生成式人工智能平台可以促进快速创新，并帮助企业实现更快的结果和客户体验的提升。在大型语言模型的支持下，它是一个安全的可以解决现实世界企业挑战的平台。TechBud.AI是一个可靠、安全的技术专家级人工智能伙伴，可以解决查询、支持任务，让用户的生活更轻松。（来源：动点科技）

2、Yellow.ai 推出生成式 AI 驱动型 ChatBots 和 VoiceBots 解决方案

对话式人工智能企业Yellow.ai近日宣布，其用于实现客户与员工体验自动化的生成式 AI 驱动型 ChatBots（聊天机器人）和 VoiceBots（语音机器人）解决方案现已通过 SAP 与合作伙伴产品数字平台 SAP Store 推出。这两款解决方案均采用 SAP Integration Suite（集成套件），并基于 SAP Business Technology Platform（业务技术平台）而构建。其中，客户体验（CX）解决方案与SAP Commerce、SAP Commerce Cloud、SAP CRM Sales 和 SAP CRM Service Manager 集成；员工体验 (EX) 解决方案与 SAP SuccessFactors Employee Central（核心人事云）集成。（来源：动点科技）

3、帮助更多企业低成本落地AI，「清昴智能」完成数千万元的天使轮融资

AI推理部署解决方案提供商「清昴智能」于今日宣布完成数千万元的天使轮融资。本轮融资由绿洲资本独家领投，融资资金将主要用于算法研发、产品开发和团队扩充。在成立之初，清昴智能还完成了来自奇绩创坛的种子轮融资。（来源：36氪）

AI PC装机指南