【2023年11月16日AI晚报】WPS AI开启公测,面向用户开放体验;OPPO推出安第斯大模型AndesGPT

160次阅读
没有评论

共计 7127 个字符,预计需要花费 18 分钟才能阅读完成。

AI·快讯

1、谷歌天气预报模型 GraphCast 登刊 Science

11 月 14 日,国际顶刊《科学》(Science)刊发了谷歌 DeepMind 研究团队的一篇论文,该论文描述了天气预报模型 GraphCast,它能在一分钟内预测全球 0.25°分辨率下 10 天内的数百个天气变量。在 1380 个验证目标中,GraphCast 在 90% 的目标上优于欧洲中期天气预报中心(ECMWF)的高分辨率预报(HRES),后者被认为是全球最准确的天气预报模型之一。研究团队还将 GraphCast 的性能与基于 ML 的顶级天气预报模型盘古大模型进行了比较,发现 GraphCast 在 252 个目标中的 99.2% 上都表现更佳。

论文地址:https://www.science.org/doi/10.1126/science.adi2336

2、微软等开发基于 GPT-4V 的 Agent 与手机交互

11 月 13 日,来自加州大学圣地亚哥分校、微软等机构的研究团队发表论文,开发了一种基于 GPT-4V 的 Agent——MM-Navigator,用于开展智能手机用户界面的导航任务。研究表明无需任何训练,GPT-4V 就能直接像人类一样与智能手机进行交互,完成各种指定命令。根据测试,GPT-4V 在 iPhone 上完成类似“在 50-100 美元的预算内购买一个打奶泡的工具”任务的成功率可达 75%。在安卓机上的测试整体来看,MM-Navigator 在执行安装、购物等任务中的总体表现最高得分为 52.96%,Llama 2、PaLM 2 和 ChatGPT 等基线模型最高 39.6%。

论文地址:https://arxiv.org/abs/2311.07562

3、WPS AI 开启公测,面向用户开放体验

16 日,金山办公宣布旗下具备大语言模型能力的人工智能办公应用 WPS AI 开启公测,AI 功能面向全体用户陆续开放体验。金山办公 CEO 章庆元表示,金山办公将 WPS AI 定位为大语言模型的应用方,锚定 AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展。(来源: 快科技

地址:https://ai.wps.cn

【2023 年 11 月 16 日 AI 晚报】WPS AI 开启公测,面向用户开放体验;OPPO 推出安第斯大模型 AndesGPT

4、OPPO 推出安第斯大模型 AndesGPT

OPPO 推出自主训练、个性专属的大模型安第斯大模型——AndesGPT。据介绍,AndesGPT 拥有对话增强、个人专属和端云协同三大技术特征,及知识、记忆、工具与创作四大核心能力。据悉,全新的小布助手已经接入 AndesGPT 大模型,支持通话助手,智能摘要功能可以提取通话记录的重要内容,还可以搞定复杂手机操作,帮你生成定制内容、总结摘要等等。

【2023 年 11 月 16 日 AI 晚报】WPS AI 开启公测,面向用户开放体验;OPPO 推出安第斯大模型 AndesGPT

5、微软推出首款 AI 自研芯片,力求避免供应链瓶颈

微软发布了首款自研人工智能芯片和云计算处理器,试图在竞争日益激烈的 AI 计算市场掌握更多技术并增加产品供应。该公司还发布可以让客户为自己设计 AI 助手的新软件。微软周三在西雅图举行的年度 Ignite 技术大会上发布了 Maia 100 芯片,这款 AI 芯片将为该公司 Azure 云客户提供一种新的方式来开发和运行生成内容的 AI 程序。负责 Azure 芯片部门的副总裁表示,微软已在用 Bing 和 Office AI 产品测试该芯片。

6、全新雅虎搜索将于 2024 年上线,未来将推更多 AI 与高级功能

在 SMX 搜索引擎营销大会上,雅虎(Yahoo!)高级副总裁兼总经理 Brian Provost 表示,新雅虎将于 2024 年的头几周推出。“我们预计雅虎搜索团队将在 2024 年的前几周(也许最快几个月后)推出更多基本功能,未来还会继续推出更多人工智能和高级功能。”

7、DeepL 在 AI 翻译领域占优

翻译是一门古老的艺术——也许和文明本身一样古老。古老的根源并没有阻碍创新,生成式 AI 的兴起引发了翻译技术的井喷式增长。数据提供商 Statista 预测,AI 翻译的全球市场将从 2023 年的约 50 亿美元增长到 2030 年的约 120 亿美元。Gartner 预测,到 2025 年人类翻译者四分之一的工作量将是审阅和编辑机器翻译文本。在这一波 AI 翻译浪潮中,德国公司 DeepL 在 Google 和 Facebook 等强大竞争对手中间脱颖而出。DeepL 自 2017 年创办以来成长迅速,可能是过去 15 年翻译领域最成功的科技公司。它支持翻译 30 种语言,有逾两万家企业客户,其中包括爱思唯尔 (Elsevier) 和富士通 (Fujitsu) 等知名公司,今年 1 月它的估值达到了 10 亿美元。尽管竞争日益激烈,DeepL 仍然对未来保持乐观,相信对翻译质量的重视能带来新机遇。

8、英伟达发布基于微软 Azure 的生成式 AI Foundry 服务,SAP SE、Amdocs 和 Getty Images 率先采用

微软 Ignite 2023 大会已于今天拉开帷幕,英伟达发布了基于微软智能云 Microsoft Azure 的 AI 工坊(AI foundry)服务,旨在帮助企业和初创公司在 Azure 上开发、调优和部署其自定义生成式 AI 应用。据介绍,这项 NVIDIA AI foundry 服务整合了 NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具,以及 NVIDIA DGX 云 AI 超算服务三大要素。

英伟达表示,它可以为企业提供创建自定义生成式 AI 模型的端到端解决方案,并且支持企业使用 NVIDIA AI Enterprise 软件部署其定制模型,以支持生成式 AI 应用,包括智能搜索、摘要和内容生成。目前,SAP SE、Amdocs 和 Getty Images 三大厂商已率先使用了这项服务来构建其自定义 AI 模型。除此之外,英伟达还宣布将更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

9、12 月上线,微软发布 Personal Voice:最短 60 秒实现用户自建 AI 音频

微软 Ignite 2023 大会已经拉开帷幕,微软 Azure AI 服务部门在本次活动中推出 Personal Voice 功能,可以使用自己的声音来创建 AI 音频。微软在博文中写道:“准备用于创建 AI 语音的训练样本可能很困难或成本高昂。不过通过 Personal Voice,最短可以在 60 秒内,让用户自建和其声音相近的 AI 声音”。此功能将率先在西欧、美国东部和东南亚地区上线,公共预览版将于 12 月 1 日上线。

【2023 年 11 月 16 日 AI 晚报】WPS AI 开启公测,面向用户开放体验;OPPO 推出安第斯大模型 AndesGPT

10、英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍、8GB 以上显卡可本地运行,支持 OpenAI 的 Chat API

微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API 的支持。英伟达面向数据中心和 Windows PC,推出 Tensor RT-LLM 开源库。最大的特点是,如果 Windows PC 配备英伟达 GeForce RTX GPU,TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。(来源:IT 之家

11、微软推出网页版 Copilot,仅限 Edge 等基于 Chromium 的浏览器访问

微软 Ignite 2023 大会于今天拉开帷幕,微软推出了专门的网页版 Copilot,以便于 Windows 和 macOS 用户,体验 Copilot 的 AI 聊天服务,此前仅限于微软的各种软件应用访问使用。值得注意的是,微软官方表示仅限于使用 Edge 或者其它基于 Chromium 的浏览器,使用 Firefox 访问会跳出不支持选项。(来源:IT 之家

地址:https://copilot.microsoft.com

12、微软发布 Windows AI Studio,在 Win11 上简化开发 AI 应用体验

微软在今天开幕的 Ignite 2023 大会中,面向开发者推出了全新的“Windows AI Studio”体验,在 Win11 系统上可以简化、加速 AI 应用的开发工作。除了简化构建 AI 体验的设置过程外,Windows AI Studio 还将突出显示专门针对 GPU 和 NPU 优化的 AI 模型,只是该功能会后续推出。(来源:IT 之家

13、微软宣布 Bing Chat 及其 Enterprise 企业版更名为 Copilot

在今天的 Microsoft Ignite 2023 开发者大会上,微软宣布 Bing Chat 及其企业高级版 Bing Chat for Enterprise 正式更名为 Copilot!微软通讯总监 Caitlin Roulston 表示,“将‘Bing Chat Enterprise’更名为‘Copilot’反映了我们为消费者和商业客户打造统一的 Copilot 体验的愿景”。(来源:IT 之家

14、ChatGPT 代码解释器被发现存在漏洞,黑客利用可窃取你的数据

OpenAI 近日为 ChatGPT 推出了全新的代码解释器(Code Interpreter)工具,可以帮助程序员调试、完善代码编程工作。不过根据 Johann Rehberger 网络安全专家、Tom's Hardware 等多家国外媒体报道,由于该代码解释器工具可以处理任何电子表格文件,并能以图表的形式分析和呈现数据,黑客可以欺骗 ChatGPT 聊天机器人,让其执行来自第三方 URL 的指令。(来源:IT 之家

15、微软推出 Copilot Studio 工具、为 Copilot for Microsoft 365 引入新功能

微软在近日召开的 Ignite 2023 活动中,介绍展示了 Microsoft Copilot 套件的一系列增强功能。这个创新工具提供了一种低代码(low-code)方法,支持为 Microsoft 365 定制 Copilot,并创建独立的 Copilot 应用。(来源:IT 之家

【2023 年 11 月 16 日 AI 晚报】WPS AI 开启公测,面向用户开放体验;OPPO 推出安第斯大模型 AndesGPT

16、谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。谷歌和谷歌 Deepmind 的研究人员提出了新的方法,将多模态理解扩展到长视频领域。(来源:IT 之家

17、TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现

业内领先的科研机构、美国国家超级计算中心和诸多 AI 领域龙头公司,近日联合组建了万亿参数联盟(Trillion Parameter Consortium,简称 TPC)。TPC 联盟由来自全球实验室、科研机构、学术界和工业界的科学家组成,目标是共同推进用于科学发现的 AI 模型,特别关注一万亿或更多参数的巨型模型。TPC 联盟目前已经正在开发可扩展模型架构和训练策略,组织和整理用于模型训练的科学数据,为当前和未来的百万兆次级计算平台优化 AI 库。(来源:IT 之家

18、微软公布 Text To Speech Avatar AI 工具:可制作虚拟 3D 数字人、基于 Azure 平台

微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。(来源:IT 之家

【2023 年 11 月 16 日 AI 晚报】WPS AI 开启公测,面向用户开放体验;OPPO 推出安第斯大模型 AndesGPT

19、Adobe 演示 Sound Lift 工具:可分层人声和噪音音轨

Adobe 公司近日宣布正在开发名为 Project Sound Lift 的全新音频工具,可以解构录音内容,像图片一样分解成不同的声音层。Sound Lift 工具主要采用 AI 技术,可以分开掌声等嘈杂的背景声音和某人的演讲声音。Adobe 表示 Sound Lift 工具仍处于开发阶段,未来上线之后,用户只需要导入音频文件,然后该工具就可以帮助你过滤掌声、笑声、警报、演讲、人群、交通、打字等诸多背景声音。Project Sound Lift 会自动检测每个声音,并吐出单独的文件,其中包含背景噪音,某人的声音或乐器的声音等。(来源:IT 之家

20、APUS 与深圳大学大数据国家工程实验室达成战略合作,联合训练开源中文大模型

近日,APUS 与深圳大学大数据系统计算技术国家工程实验室达成战略合作。双方集成各自优势联合开发、开源高性能中文多模态大模型 Linly-Chinese-LLaMA-2-70B。据介绍,该模型将更加适配中文服务场景,计划于 2024 年初在 APUS 开源平台、GitHub 及 Hugging Face 开源平台向公众开放。

21、微软必应现可使用人工智能为搜索结果生成标题,以提高搜索效率

微软必应搜索引擎现在可使用人工智能为部分搜索结果生成标题,该功能使用了 GPT-4 技术,可使“搜索结果更加相关和有信息量,帮助用户更快地找到他们想要的网站。”如果用户搜索某个关键词,然后点击搜索结果中的标题链接旁边的向下箭头,可以看到一些结果上标有“AI-Generated Caption(人工智能生成的标题)”。

【2023 年 11 月 16 日 AI 晚报】WPS AI 开启公测,面向用户开放体验;OPPO 推出安第斯大模型 AndesGPT

22、韩国央行警告:AI 或抢走该国 400 万人的“饭碗”

韩国央行近日发布了一项关于人工智能(AI)对劳动力市场影响的研究报告,预测未来 20 年,AI 可能会导致该国多达 400 万个工作岗位消失,占总工作岗位的 14%。这是继高盛、麦肯锡等机构之后,又一次对 AI 威胁的警示。据韩国央行的分析师团队周四透露,由于 AI 可以更有效地完成分析和认知类的任务,因此学历和收入较高的工人将面临更大的风险。他们指出,化学家、医生、律师、会计师和资产经理人等职业最容易被 AI 取代,而餐饮、教育和音乐等领域的工作则相对安全。(来源:IT 之家

23、YouTube 推出可模仿著名歌手的 AI 工具,可用文字或哼唱创作歌曲

YouTube 正在测试新的生成式 AI 功能,让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track,已经向平台上的一些创作者提供,它可以根据著名艺人的风格自动生成 30 秒的音乐片段。该功能可以模仿九位不同的艺人,他们都是 YouTube 在开发这个功能时的合作伙伴。YouTube 还展示了一些可以通过哼唱生成音乐的新工具。(来源:IT 之家

【2023 年 11 月 16 日 AI 晚报】WPS AI 开启公测,面向用户开放体验;OPPO 推出安第斯大模型 AndesGPT

24、谷歌将“水印”嵌入人工智能生成的音乐中,人耳无法察觉

谷歌旗下的人工智能公司 DeepMind 宣布,其开发的 AI 音频生成模型 Lyria 将使用 SynthID 技术给生成的音频添加“水印”,以便人们在事后识别出它们是由 AI 制作的。DeepMind 在一篇博客文章中表示,这种水印不会被人耳察觉,也不会影响聆听体验,并且即使音频被压缩、加快或减慢,或者添加了额外的噪音,水印仍然可以被检测出来。SynthID 等水印工具被视为防范生成型 AI 造成危害的重要保障,这是一个有前景的领域,但目前的技术还远不能成为防御伪造的万能钥匙。(来源:IT 之家

AI·发布会

1、微软加入自定义 GPT 大战!Bing Chat 改名,自研芯片登场,连甩 13 项 AI 升级

今日凌晨,微软在年度 IT 专业人士和开发者大会 Ignite 上推出了一系列 AI 新产品,包括 AI 芯片、AI 服务器、Copilot 系列应用、Windows AI 开发平台、微软 Azure MaaS(模型即服务)、Fabric 数据平台、MR 头显助手等方面的 100 多项更新。八个月前,微软推出了适用于 Microsoft 365 的 Copilot 服务,据其调查,这一服务目前已获得 70% 用户在效率提高方面的肯定,同时 68% 的用户表示 Copilot 提高了他们的工作质量。(来源: 智东西

本次,微软进一步重新思考云基础设施,扩展微软 Copilot 体验,加强数据和 AI 的连接,并通过 Azure AI 为开发人员带来更多新功能,重点如下:

  1. 推出两款自研芯片:云端 AI 芯片微软 Azure Maia 100、服务器 CPU 微软 Azure Cobalt 100。
  2. 推出针对英伟达 H100 GPU 的 NC H100 v5 虚拟机系列预览,在 Azure 中加入 AMD MI300X 加速虚拟机。
  3. 微软 Copilot 支持构建个性化角色,根据用户偏好提供定制化响应。
  4. 微软 Copilot 数学和逻辑能力增强,支持用编程语言执行复杂数学分析,与 Excel 结合实现智能制表等。
  5. Copilot 全面接入 Microsoft 365,会议平台 Teams、电子邮箱 Outlook、文档工具 Word、PPT 工具 PowerPoint 等同步升级。
  6. 推出微软 Loop 生成式 AI 协同创作工具,结合组织既有知识进行任务执行。
  7. 推出低代码开发工具微软 Copilot Studio,支持用户在微软 365 自定义 Copilot 和构建私有化 Copilot。
  8. 免提 Copilot 将上线 MR 头显产品 HoloLens 2,助用户使用自然语言和人类手势实现交互。
  9. 推出面向 Azure 云的 Copilot,提供 IT 管理的 AI 伴侣。
  10. 简化用户体验,Bing Chat 和 Bing Chat Enterprise 现在统归 Copilot,Copilot 成其 AI 聊天机器人主要品牌。
  11. 微软 Fabric 大规模数据产品全面上线,推出 Copilot in Fabric 的公开预览版。
  12. 推出 MaaS 功能,将集成 GPT-4 Turbo、Llama 2 等多样化模型,支持企业在微软云上开发定制大模型。
  13. 推出 Windows AI Studio 开发平台,助企业和开发人员在 Windows 上快速启动本地 AI 开发和部署。
正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-11-16发表,共计7127字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。