共计 7127 个字符,预计需要花费 18 分钟才能阅读完成。
AI·快讯
1、谷歌天气预报模型 GraphCast 登刊 Science
11 月 14 日,国际顶刊《科学》(Science)刊发了谷歌 DeepMind 研究团队的一篇论文,该论文描述了天气预报模型 GraphCast,它能在一分钟内预测全球 0.25°分辨率下 10 天内的数百个天气变量。在 1380 个验证目标中,GraphCast 在 90% 的目标上优于欧洲中期天气预报中心(ECMWF)的高分辨率预报(HRES),后者被认为是全球最准确的天气预报模型之一。研究团队还将 GraphCast 的性能与基于 ML 的顶级天气预报模型盘古大模型进行了比较,发现 GraphCast 在 252 个目标中的 99.2% 上都表现更佳。
2、微软等开发基于 GPT-4V 的 Agent 与手机交互
11 月 13 日,来自加州大学圣地亚哥分校、微软等机构的研究团队发表论文,开发了一种基于 GPT-4V 的 Agent——MM-Navigator,用于开展智能手机用户界面的导航任务。研究表明无需任何训练,GPT-4V 就能直接像人类一样与智能手机进行交互,完成各种指定命令。根据测试,GPT-4V 在 iPhone 上完成类似“在 50-100 美元的预算内购买一个打奶泡的工具”任务的成功率可达 75%。在安卓机上的测试整体来看,MM-Navigator 在执行安装、购物等任务中的总体表现最高得分为 52.96%,Llama 2、PaLM 2 和 ChatGPT 等基线模型最高 39.6%。
3、WPS AI 开启公测,面向用户开放体验
16 日,金山办公宣布旗下具备大语言模型能力的人工智能办公应用 WPS AI 开启公测,AI 功能面向全体用户陆续开放体验。金山办公 CEO 章庆元表示,金山办公将 WPS AI 定位为大语言模型的应用方,锚定 AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展。(来源: 快科技 )
4、OPPO 推出安第斯大模型 AndesGPT
OPPO 推出自主训练、个性专属的大模型安第斯大模型——AndesGPT。据介绍,AndesGPT 拥有对话增强、个人专属和端云协同三大技术特征,及知识、记忆、工具与创作四大核心能力。据悉,全新的小布助手已经接入 AndesGPT 大模型,支持通话助手,智能摘要功能可以提取通话记录的重要内容,还可以搞定复杂手机操作,帮你生成定制内容、总结摘要等等。
5、微软推出首款 AI 自研芯片,力求避免供应链瓶颈
微软发布了首款自研人工智能芯片和云计算处理器,试图在竞争日益激烈的 AI 计算市场掌握更多技术并增加产品供应。该公司还发布可以让客户为自己设计 AI 助手的新软件。微软周三在西雅图举行的年度 Ignite 技术大会上发布了 Maia 100 芯片,这款 AI 芯片将为该公司 Azure 云客户提供一种新的方式来开发和运行生成内容的 AI 程序。负责 Azure 芯片部门的副总裁表示,微软已在用 Bing 和 Office AI 产品测试该芯片。
6、全新雅虎搜索将于 2024 年上线,未来将推更多 AI 与高级功能
在 SMX 搜索引擎营销大会上,雅虎(Yahoo!)高级副总裁兼总经理 Brian Provost 表示,新雅虎将于 2024 年的头几周推出。“我们预计雅虎搜索团队将在 2024 年的前几周(也许最快几个月后)推出更多基本功能,未来还会继续推出更多人工智能和高级功能。”
7、DeepL 在 AI 翻译领域占优
翻译是一门古老的艺术——也许和文明本身一样古老。古老的根源并没有阻碍创新,生成式 AI 的兴起引发了翻译技术的井喷式增长。数据提供商 Statista 预测,AI 翻译的全球市场将从 2023 年的约 50 亿美元增长到 2030 年的约 120 亿美元。Gartner 预测,到 2025 年人类翻译者四分之一的工作量将是审阅和编辑机器翻译文本。在这一波 AI 翻译浪潮中,德国公司 DeepL 在 Google 和 Facebook 等强大竞争对手中间脱颖而出。DeepL 自 2017 年创办以来成长迅速,可能是过去 15 年翻译领域最成功的科技公司。它支持翻译 30 种语言,有逾两万家企业客户,其中包括爱思唯尔 (Elsevier) 和富士通 (Fujitsu) 等知名公司,今年 1 月它的估值达到了 10 亿美元。尽管竞争日益激烈,DeepL 仍然对未来保持乐观,相信对翻译质量的重视能带来新机遇。
8、英伟达发布基于微软 Azure 的生成式 AI Foundry 服务,SAP SE、Amdocs 和 Getty Images 率先采用
微软 Ignite 2023 大会已于今天拉开帷幕,英伟达发布了基于微软智能云 Microsoft Azure 的 AI 工坊(AI foundry)服务,旨在帮助企业和初创公司在 Azure 上开发、调优和部署其自定义生成式 AI 应用。据介绍,这项 NVIDIA AI foundry 服务整合了 NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具,以及 NVIDIA DGX 云 AI 超算服务三大要素。
英伟达表示,它可以为企业提供创建自定义生成式 AI 模型的端到端解决方案,并且支持企业使用 NVIDIA AI Enterprise 软件部署其定制模型,以支持生成式 AI 应用,包括智能搜索、摘要和内容生成。目前,SAP SE、Amdocs 和 Getty Images 三大厂商已率先使用了这项服务来构建其自定义 AI 模型。除此之外,英伟达还宣布将更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。
9、12 月上线,微软发布 Personal Voice:最短 60 秒实现用户自建 AI 音频
微软 Ignite 2023 大会已经拉开帷幕,微软 Azure AI 服务部门在本次活动中推出 Personal Voice 功能,可以使用自己的声音来创建 AI 音频。微软在博文中写道:“准备用于创建 AI 语音的训练样本可能很困难或成本高昂。不过通过 Personal Voice,最短可以在 60 秒内,让用户自建和其声音相近的 AI 声音”。此功能将率先在西欧、美国东部和东南亚地区上线,公共预览版将于 12 月 1 日上线。
10、英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍、8GB 以上显卡可本地运行,支持 OpenAI 的 Chat API
微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API 的支持。英伟达面向数据中心和 Windows PC,推出 Tensor RT-LLM 开源库。最大的特点是,如果 Windows PC 配备英伟达 GeForce RTX GPU,TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。(来源:IT 之家 )
11、微软推出网页版 Copilot,仅限 Edge 等基于 Chromium 的浏览器访问
微软 Ignite 2023 大会于今天拉开帷幕,微软推出了专门的网页版 Copilot,以便于 Windows 和 macOS 用户,体验 Copilot 的 AI 聊天服务,此前仅限于微软的各种软件应用访问使用。值得注意的是,微软官方表示仅限于使用 Edge 或者其它基于 Chromium 的浏览器,使用 Firefox 访问会跳出不支持选项。(来源:IT 之家 )
12、微软发布 Windows AI Studio,在 Win11 上简化开发 AI 应用体验
微软在今天开幕的 Ignite 2023 大会中,面向开发者推出了全新的“Windows AI Studio”体验,在 Win11 系统上可以简化、加速 AI 应用的开发工作。除了简化构建 AI 体验的设置过程外,Windows AI Studio 还将突出显示专门针对 GPU 和 NPU 优化的 AI 模型,只是该功能会后续推出。(来源:IT 之家 )
13、微软宣布 Bing Chat 及其 Enterprise 企业版更名为 Copilot
在今天的 Microsoft Ignite 2023 开发者大会上,微软宣布 Bing Chat 及其企业高级版 Bing Chat for Enterprise 正式更名为 Copilot!微软通讯总监 Caitlin Roulston 表示,“将‘Bing Chat Enterprise’更名为‘Copilot’反映了我们为消费者和商业客户打造统一的 Copilot 体验的愿景”。(来源:IT 之家 )
14、ChatGPT 代码解释器被发现存在漏洞,黑客利用可窃取你的数据
OpenAI 近日为 ChatGPT 推出了全新的代码解释器(Code Interpreter)工具,可以帮助程序员调试、完善代码编程工作。不过根据 Johann Rehberger 网络安全专家、Tom’s Hardware 等多家国外媒体报道,由于该代码解释器工具可以处理任何电子表格文件,并能以图表的形式分析和呈现数据,黑客可以欺骗 ChatGPT 聊天机器人,让其执行来自第三方 URL 的指令。(来源:IT 之家 )
15、微软推出 Copilot Studio 工具、为 Copilot for Microsoft 365 引入新功能
微软在近日召开的 Ignite 2023 活动中,介绍展示了 Microsoft Copilot 套件的一系列增强功能。这个创新工具提供了一种低代码(low-code)方法,支持为 Microsoft 365 定制 Copilot,并创建独立的 Copilot 应用。(来源:IT 之家 )
16、谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。谷歌和谷歌 Deepmind 的研究人员提出了新的方法,将多模态理解扩展到长视频领域。(来源:IT 之家 )
17、TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现
业内领先的科研机构、美国国家超级计算中心和诸多 AI 领域龙头公司,近日联合组建了万亿参数联盟(Trillion Parameter Consortium,简称 TPC)。TPC 联盟由来自全球实验室、科研机构、学术界和工业界的科学家组成,目标是共同推进用于科学发现的 AI 模型,特别关注一万亿或更多参数的巨型模型。TPC 联盟目前已经正在开发可扩展模型架构和训练策略,组织和整理用于模型训练的科学数据,为当前和未来的百万兆次级计算平台优化 AI 库。(来源:IT 之家 )
18、微软公布 Text To Speech Avatar AI 工具:可制作虚拟 3D 数字人、基于 Azure 平台
微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。(来源:IT 之家 )
19、Adobe 演示 Sound Lift 工具:可分层人声和噪音音轨
Adobe 公司近日宣布正在开发名为 Project Sound Lift 的全新音频工具,可以解构录音内容,像图片一样分解成不同的声音层。Sound Lift 工具主要采用 AI 技术,可以分开掌声等嘈杂的背景声音和某人的演讲声音。Adobe 表示 Sound Lift 工具仍处于开发阶段,未来上线之后,用户只需要导入音频文件,然后该工具就可以帮助你过滤掌声、笑声、警报、演讲、人群、交通、打字等诸多背景声音。Project Sound Lift 会自动检测每个声音,并吐出单独的文件,其中包含背景噪音,某人的声音或乐器的声音等。(来源:IT 之家 )
20、APUS 与深圳大学大数据国家工程实验室达成战略合作,联合训练开源中文大模型
近日,APUS 与深圳大学大数据系统计算技术国家工程实验室达成战略合作。双方集成各自优势联合开发、开源高性能中文多模态大模型 Linly-Chinese-LLaMA-2-70B。据介绍,该模型将更加适配中文服务场景,计划于 2024 年初在 APUS 开源平台、GitHub 及 Hugging Face 开源平台向公众开放。
21、微软必应现可使用人工智能为搜索结果生成标题,以提高搜索效率
微软必应搜索引擎现在可使用人工智能为部分搜索结果生成标题,该功能使用了 GPT-4 技术,可使“搜索结果更加相关和有信息量,帮助用户更快地找到他们想要的网站。”如果用户搜索某个关键词,然后点击搜索结果中的标题链接旁边的向下箭头,可以看到一些结果上标有“AI-Generated Caption(人工智能生成的标题)”。
22、韩国央行警告:AI 或抢走该国 400 万人的“饭碗”
韩国央行近日发布了一项关于人工智能(AI)对劳动力市场影响的研究报告,预测未来 20 年,AI 可能会导致该国多达 400 万个工作岗位消失,占总工作岗位的 14%。这是继高盛、麦肯锡等机构之后,又一次对 AI 威胁的警示。据韩国央行的分析师团队周四透露,由于 AI 可以更有效地完成分析和认知类的任务,因此学历和收入较高的工人将面临更大的风险。他们指出,化学家、医生、律师、会计师和资产经理人等职业最容易被 AI 取代,而餐饮、教育和音乐等领域的工作则相对安全。(来源:IT 之家 )
23、YouTube 推出可模仿著名歌手的 AI 工具,可用文字或哼唱创作歌曲
YouTube 正在测试新的生成式 AI 功能,让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track,已经向平台上的一些创作者提供,它可以根据著名艺人的风格自动生成 30 秒的音乐片段。该功能可以模仿九位不同的艺人,他们都是 YouTube 在开发这个功能时的合作伙伴。YouTube 还展示了一些可以通过哼唱生成音乐的新工具。(来源:IT 之家 )
24、谷歌将“水印”嵌入人工智能生成的音乐中,人耳无法察觉
谷歌旗下的人工智能公司 DeepMind 宣布,其开发的 AI 音频生成模型 Lyria 将使用 SynthID 技术给生成的音频添加“水印”,以便人们在事后识别出它们是由 AI 制作的。DeepMind 在一篇博客文章中表示,这种水印不会被人耳察觉,也不会影响聆听体验,并且即使音频被压缩、加快或减慢,或者添加了额外的噪音,水印仍然可以被检测出来。SynthID 等水印工具被视为防范生成型 AI 造成危害的重要保障,这是一个有前景的领域,但目前的技术还远不能成为防御伪造的万能钥匙。(来源:IT 之家 )
AI·发布会
1、微软加入自定义 GPT 大战!Bing Chat 改名,自研芯片登场,连甩 13 项 AI 升级
今日凌晨,微软在年度 IT 专业人士和开发者大会 Ignite 上推出了一系列 AI 新产品,包括 AI 芯片、AI 服务器、Copilot 系列应用、Windows AI 开发平台、微软 Azure MaaS(模型即服务)、Fabric 数据平台、MR 头显助手等方面的 100 多项更新。八个月前,微软推出了适用于 Microsoft 365 的 Copilot 服务,据其调查,这一服务目前已获得 70% 用户在效率提高方面的肯定,同时 68% 的用户表示 Copilot 提高了他们的工作质量。(来源: 智东西 )
本次,微软进一步重新思考云基础设施,扩展微软 Copilot 体验,加强数据和 AI 的连接,并通过 Azure AI 为开发人员带来更多新功能,重点如下:
- 推出两款自研芯片:云端 AI 芯片微软 Azure Maia 100、服务器 CPU 微软 Azure Cobalt 100。
- 推出针对英伟达 H100 GPU 的 NC H100 v5 虚拟机系列预览,在 Azure 中加入 AMD MI300X 加速虚拟机。
- 微软 Copilot 支持构建个性化角色,根据用户偏好提供定制化响应。
- 微软 Copilot 数学和逻辑能力增强,支持用编程语言执行复杂数学分析,与 Excel 结合实现智能制表等。
- Copilot 全面接入 Microsoft 365,会议平台 Teams、电子邮箱 Outlook、文档工具 Word、PPT 工具 PowerPoint 等同步升级。
- 推出微软 Loop 生成式 AI 协同创作工具,结合组织既有知识进行任务执行。
- 推出低代码开发工具微软 Copilot Studio,支持用户在微软 365 自定义 Copilot 和构建私有化 Copilot。
- 免提 Copilot 将上线 MR 头显产品 HoloLens 2,助用户使用自然语言和人类手势实现交互。
- 推出面向 Azure 云的 Copilot,提供 IT 管理的 AI 伴侣。
- 简化用户体验,Bing Chat 和 Bing Chat Enterprise 现在统归 Copilot,Copilot 成其 AI 聊天机器人主要品牌。
- 微软 Fabric 大规模数据产品全面上线,推出 Copilot in Fabric 的公开预览版。
- 推出 MaaS 功能,将集成 GPT-4 Turbo、Llama 2 等多样化模型,支持企业在微软云上开发定制大模型。
- 推出 Windows AI Studio 开发平台,助企业和开发人员在 Windows 上快速启动本地 AI 开发和部署。