【2023年6月25日AI晚报】谷歌推出一款能说会听的大语言模型AudioPaLM;AI 作画工具 Midjourney 迎来 5.2 版本更新

210次阅读
没有评论

共计 4431 个字符,预计需要花费 12 分钟才能阅读完成。

AI·快讯

1、亚马迅云推出生成式 AI 创新中心

据亚马逊消息,亚马逊将投资 1 亿美元,推出全新 AI 项目 AWS 生成式 AI 创新中心。据悉,该项目将 AWS 附属的数据科学家、策略师、工程师和解决方案设计师同客户及合作伙伴联系起来,帮助企业客户运用生成式 AI 技术,加快他们创新和成功的速度。亚马逊表示,该项目目前已在和两家客户 Highspot 和 Twilio 合作。

2、报告称 5 月美国生成式 AI 岗位激增 20%

根据招聘求职网站 Indeed 公布的最新数据,今年 5 月美国生成式 AI 相关的职位数量环比增加了 20%,表明越来越多的美国企业希望搭上风口,布局或者利用该技术,推动企业发展。5 月数据显示,美国每百万岗位招聘信息中有 204 个生成式 AI 相关岗位,是 2021 年的 2 倍多。在 Indeed 的人工智能岗位中,数据科学家职位占比 5%、软件工程师、机器学习工程师和数据工程师等职位也很受企业欢迎。

3、AI 入局世界网球温布顿锦标赛,可分析赢球概率及生成球评

在去年 12 月举行的卡塔尔世界杯中,AI 已经崭露头角,裁判使用 AI 配合检测器,对球员进行越位判决。而今年更多体育竞赛将引入 AI,以提升球场工作人员效率。全英草地网球俱乐部和 IBM 近日宣布,即将在 7 月 3 日到 7 月 16 日开打的世界网球四大公开赛之一的温布顿(Wimbledon)网球锦标赛,将采用以 AI 技术提供球评及球员赢球几率预测分析。(来源:IT 之家

4、AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,表示训练成本仅为竞品零头

AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元(约 502.44 万元人民币),远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。MosaicML 公司表示,将模型扩展到 300 亿参数只是第一步,接下来他们将以降低成本为前提,推出体积更大、质量更高的模型。(来源:IT 之家

地址:https://huggingface.co/mosaicml/mpt-30b

【2023 年 6 月 25 日 AI 晚报】谷歌推出一款能说会听的大语言模型 AudioPaLM;AI 作画工具 Midjourney 迎来 5.2 版本更新

5、美国商务部宣布成立 AI 公共工作组,应对生成式人工智能潜在风险

美国商务部部长吉娜・雷蒙多(Gina Raimondo)日前宣布,美国国家标准与技术研究院(NIST)将成立一个新的人工智能(AI)公共工作组,该工作组将在 NIST 人工智能风险管理框架(RMF)的成功基础上,进一步解决 AI 技术快速发展带来的问题。美国商务部表示,该工作组将招募来自私营和公共部门的志愿者与技术专家,并将重点关注与生成式 AI 相关的风险,因为生成式 AI 正在推动技术和市场的快速变化。

NIST 为工作组制定了短期、中期和长期目标。短期内,该工作组将提供指导意见,向外界介绍如何使用 NISF 的 AI 风险管理框架来支持生成式 AI 研发。中期来看,该工作组将支持 NIST 在生成式 AI 相关的测试、评估等方面的工作。长期来看,该工作组将探索有效利用生成式 AI 来解决社会问题的可能性,例如健康、环境和气候变化等议题。

【2023 年 6 月 25 日 AI 晚报】谷歌推出一款能说会听的大语言模型 AudioPaLM;AI 作画工具 Midjourney 迎来 5.2 版本更新

6、Dropbox 测试 AI 搜索工具 Dropbox Dash

Dropbox 近日发布 AI 搜索工具 Dropbox Dash,帮助提高工作效率,简化工作流程。Dropbox Dash 拥有 AI 驱动的搜索功能,将多个办公平台和应用聚合在一起,提高用户的搜索效率。他可以让用户在搜索栏中快速找到自己所需要的信息。Dropbox Dash 还具备堆栈功能,可以帮助用户快速存储和整理相关地址。据悉,Dropbox Dash 将会在未来引入生成式对答功能,根据用户提问进行回答。目前 Dropbox Dash 正在进行小范围测试,上线时间尚不确定。(来源:IT 之家

【2023 年 6 月 25 日 AI 晚报】谷歌推出一款能说会听的大语言模型 AudioPaLM;AI 作画工具 Midjourney 迎来 5.2 版本更新

7、谷歌推出 AudioPaLM,一款能说会听的大语言模型

据 huggingface 页面显示,谷歌研究团队近日推出一款大语言模型产品 AudioPaLM,可以实现语音理解和生成功能。AudioPaLM 将两个大语言模型 PaLM-2 和 AudioLM 融合到一个统一的多模态架构之中,利用该架构处理和生成文本和语音。AudioPaLM 还支持语音识别以及语音翻译。试验表明,AudioPaLM 的表现显著优于现有的语音翻译系统。

地址:https://huggingface.co/papers/2306.12925

【2023 年 6 月 25 日 AI 晚报】谷歌推出一款能说会听的大语言模型 AudioPaLM;AI 作画工具 Midjourney 迎来 5.2 版本更新

8、掌趣科技与悠米达成合作,将共同开发 AI 游戏创作平台

掌趣科技近日宣布与悠米达成战略合作。据悉,双方将共同开发“AI 游戏创作平台”,降低开放世界游戏的开发门槛,实现个人及小团队也可以开发大规模的开放世界游戏,并通过该平台分享游戏成果。据悉,掌趣科技将基于自身在游戏及 AI 技术、产品、运营、渠道等方面的优势,结合悠米在 3A 开放世界、万人同时在线交互、高精度物理仿真、数字人及虚拟现实场景编辑等领域的技术储备,实现在游戏创作和游戏体验方面的 AI 化提升,打造“AI+UGC”平台。

9、视频生成模型 zeroscope_v2 XL 开源

据 huggingface 页面显示,一款名为 zeroscope_v2 XL 的视频生成模型现已开源。zeroscope_v2 XL 基于 Modelscope 打造,可以通过文本生成 16:9 的高质量视频。据悉,zeroscope_v2 XL 采用 24 帧、576×320 分辨率的 9923 个剪辑和 29769 个标记帧进行训练。

地址:https://huggingface.co/cerspense/zeroscope_v2_XL

10、Stable Diffusion 版本更新,生成图片更加真实

Stability AI 近日宣布,推出 SDXL 0.9 版本更新,对 Stable Diffusion 文本生成图片模型进行了升级。升级之后的 Stable Diffusion 可以呈现更加逼真的图片效果,而且图像和构图细节也得以改进。Stability AI 表示用户可以通过 ClipDrop 访问该模型,即将推出相关的 API,预计会在今年 7 月中旬发布的 1.0 版本。( 来源

【2023 年 6 月 25 日 AI 晚报】谷歌推出一款能说会听的大语言模型 AudioPaLM;AI 作画工具 Midjourney 迎来 5.2 版本更新

11、OpenAI 首席执行官表态支持欧盟 AI 监管

欧盟产业主管埃里·布雷顿在美国加州会见 Meta 公司首席执行官扎克伯格和 OpenAI 首席执行官奥特曼等人。布雷顿表示,他和扎克伯格在欧盟的人工智能监管问题上“意见一致”,目前正在进行最后的谈判。布雷顿说,他们就水印等措施达成了一致。OpenAI 首席执行官奥特曼说,他也同意欧盟在人工智能方面的做法,并补充说:“我真的很感谢欧洲的机构在这里,以及对这个问题如此认真对待的远见,对世界其他地区也是如此。”

12、YouTube 将推出 AI 配音功能,支持多种语言配音

YouTube 近日宣布与 Aloud 合作,推出全新的 AI 语音功能,该功能目前正在测试之中,计划在 2024 年上线。据悉,这项功能可以帮助创作者为视频自动配音,并将配音翻译为其他的语言。AI 会先将原本的内容转换成文字并进行翻译,之后会由 AI 根据翻译后的语言生成相应的配音。YouTube 相信,为视频配备不同语言的配音可以吸引更多的观众收看。

13、AI 作画工具 Midjourney 迎来 5.2 版本更新,可生成相机“变焦效果”

AI 作画工具 Midjourney 日前更新了 5.2 版本,主要带来了“Zoom out”功能,可以模拟相机的“超广角、中长焦”效果,为图像添加不同焦段下的透视细节。据悉,Midjourney 5.2 版本为“Zoom out”功能带来了三种不同风格的变焦模拟,提供了三种缩放选择,分别是原始图像“镜头焦距”的 0.5、1.5 倍、2 倍效果。即原图(1.0 倍变焦)采用 50mm 焦距,则可以生成介于 28-35mm、75mm、100mm 的透视效果。(来源:IT 之家

【2023 年 6 月 25 日 AI 晚报】谷歌推出一款能说会听的大语言模型 AudioPaLM;AI 作画工具 Midjourney 迎来 5.2 版本更新

14、日本起草针对学校的生成式 AI 使用指南,禁止学生用 ChatGPT 写作文

据《读卖新闻》报道,日本文部科学省近日表示,已经针对以 ChatGPT 为代表的生成式 AI,起草了面向学校的指导方针,并将在听取专家意见后尽快发布。该草案指出,生成式 AI 带来版权侵权、虚假信息传播等各种风险,因此面向学校率先尝试“对生成式 AI 有限制的使用是适当的”。在此基础上,草案提出了关于学校使用生成式 AI 的具体“不当”案例, 包括在诗歌、俳句等文学创作活动中使用生成式 AI,或在考试中使用 。(来源:IT 之家

15、知名 AI 研究员德夫林短暂跳槽 OpenAI 后重回谷歌

据 The Information 报道,知名人工智能研究员雅各布·德夫林(Jacob Devlin)已重返原来的工作岗位。今年 1 月,德夫林在内部抱怨谷歌如何培训其聊天机器人软件 Bard AI 后,离开谷歌,加入竞争对手 OpenAI。

AI·新创

1、IGT Solutions 推出企业级生成式人工智能平台 TechBud.AI

IGT Solutions 推出了企业级生成式人工智能平台 TechBud.AI。通过企业级生成式人工智能的无缝运用,这款先进的生成式人工智能平台可以促进快速创新,并帮助企业实现更快的结果和客户体验的提升。在大型语言模型的支持下,它是一个安全的可以解决现实世界企业挑战的平台。TechBud.AI 是一个可靠、安全的技术专家级人工智能伙伴,可以解决查询、支持任务,让用户的生活更轻松。(来源: 动点科技

2、Yellow.ai 推出生成式 AI 驱动型 ChatBots 和 VoiceBots 解决方案

对话式人工智能企业 Yellow.ai 近日宣布,其用于实现客户与员工体验自动化的生成式 AI 驱动型 ChatBots(聊天机器人)和 VoiceBots(语音机器人)解决方案现已通过 SAP 与合作伙伴产品数字平台 SAP Store 推出。这两款解决方案均采用 SAP Integration Suite(集成套件),并基于 SAP Business Technology Platform(业务技术平台)而构建。其中,客户体验(CX)解决方案与 SAP Commerce、SAP Commerce Cloud、SAP CRM Sales 和 SAP CRM Service Manager 集成;员工体验 (EX) 解决方案与 SAP SuccessFactors Employee Central(核心人事云)集成。(来源: 动点科技

3、帮助更多企业低成本落地 AI,「清昴智能」完成数千万元的天使轮融资

AI 推理部署解决方案提供商「清昴智能」于今日宣布完成数千万元的天使轮融资。本轮融资由绿洲资本独家领投,融资资金将主要用于算法研发、产品开发和团队扩充。在成立之初,清昴智能还完成了来自奇绩创坛的种子轮融资。(来源:36 氪

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-06-25发表,共计4431字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。