【2023年9月25日AI晚报】OpenAI将在ChatGPT推出新的语音和图像功能；百川智能发布 Baichuan2-53B，阿里云通义千问 140 亿参数 Qwen-14B 发布

文章目录[隐藏]

[t-dark icon='']AI·快讯[/t-dark]
[t-success icon='']AI·新创[/t-success]
- 1、开放API进军To B，百川智能发布闭源大模型Baichuan2-53B

[t-dark icon='']AI·快讯[/t-dark]

1、微软升级移动端 SwiftKey 输入法应用：内置 250 多款 AI 滤镜等

微软必应博客今天发布的博文中，回顾了近期 iOS 和安卓版 Swiftkey 输入法应用程序的新功能、新特性，其中最值得关注的改进就是 AI 相机滤镜功能。用户在智能手机或者平板上使用 Swiftkey 输入法，可以进行自拍，应用内置了超过 250 款滤镜选项，可以创建有趣和照片、视频和 GIF，并允许用户直接分享给好友。

https://www.bilibili.com/video/BV17k4y1c715

2、微软 Edge 浏览器引入 Copilot：帮你写邮件、改文章、管理标签页等

微软今天发布新闻稿，表示 Edge 浏览器在整合 Copilot 后，为你的浏览器带来新一轮的 AI 创新浪潮。微软在博文中介绍了 Edge 在整合 Copilot 后的多种功能，包括根据你的提示撰写电子邮件、可以重写某段文本调整书写语气以及为标签页自动分组等等。（来源：IT之家）

3、11 月上线，微软推出 Copilot Lab：员工可交流分享 AI 使用心得

微软宣布推出 Copilot Lab，帮助员工在企业环境下使用各项 AI 工具。Copilot Lab 将随 Microsoft 365 Copilot 一起，于 11 月 1 日发布。微软对于 Copilot Lab 的构想，是成为企业员工的中心，员工可以和同事分享 AI 使用心得和建议，例如如何使用 AI 编写邮件、如何使用 AI 完成日常工作等等。（来源：IT之家）

4、百川智能发布Baichuan2-53B，开放API进军To B领域

今天，百川智能发布Baichuan2-53B闭源大模型，全面升级了Baichuan1-53B的各项能力。据介绍，Baichuan2-53B的数学和逻辑推理能力显著提升，并通过高质量数据体系和搜索增强大幅降低了模型幻觉，是目前国内幻觉问题最低的大模型。百川智能此次还开放了Baichuan2-53B API接口，宣布正式进军To B领域。

API接口文档地址：https://platform.baichuan-ai.com

5、部分 ChatGPT Plus 订阅用户可邀请他人免费试用，但仅有一次机会

ChatGPT Plus 是 ChatGPT 的付费版本，也可以理解为 ChatGPT 会员，每月花费 20 美元。ChatGPT Plus 基于 OpenAI 最先进的 GPT-4 模型开发，与普通 ChatGPT 相比可以缩短访问时间、保证用户在高峰时间段也能流畅使用。此外，它还为用户提供优先访问新功能和改进的机会，比如之前的插件功能，联网服务等。现有网友发现，部分 ChatGPT Plus 订阅用户（首批用户）可以通过邀请功能为其他人生成专属链接，受邀请用户可以免费试用 ChatGPT Plus。（来源：IT之家）

6、OpenAI将在ChatGPT推出新的语音和图像功能

OpenAI在官网宣布，将在未来两周内面向Plus和企业用户推出ChatGPT的语音和图像功能。上述功能允许用户进行语音对话或向ChatGPT展示其正在谈论的内容。语音功能将在iOS和Android平台推出，图像功能将登陆所有平台。语音输入功能类似于手机上的语音助手，用户只需按下一个按钮，说出自己的问题，ChatGPT 就会将其转换为文本，然后生成答案，再将答案转换为语音，播放给用户。图像输入功能则类似于 Google Lens，用户可以拍摄自己感兴趣的事物，并上传到 ChatGPT 中。ChatGPT 会尝试识别用户想要询问的内容，并给出相应的回答。（来源）

7、亚马逊与人工智能公司Anthropic达成战略合作，将向后者投资至多40亿美元

亚马逊宣布向 AI 创业公司 Anthropic 投资至多 40 亿美元，推动 AI 军备竞赛升级。此前微软向 OpenAI 投资数十亿美元。作为交易的一部分，Anthropic 将用亚马逊的定制芯片构建 AI 软件，并使用亚马逊的 AWS 云计算服务。亚马逊则将整合 Anthropic 的 AI 技术。Anthropic 开发了 ChatGPT 之外另一个备受瞩目的 AI 聊天机器人 Claude 2，支持最高 100k 上下文。（来源）

8、阿里云通义千问140亿参数Qwen-14B发布

今天，阿里云举办通义千问开源发布会，正式发布通义千问140亿参数模型Qwen-14B及对话模型Qwen-14B-Chat，开源、免费。据介绍，Qwen-14B在众多同尺寸20B以内开源模型中突出重围，在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评集上都取得了最优成绩，超越所有测评中的SOTA大模型。此外，通义千问团队还升级了Qwen模型对接外部系统的能力，开发者可以通过简单的操作实现复杂的插件调用，也可以基于Qwen系列基座模型快速开发Agent等AI系统，利用Qwen的理解和规划能力完成复杂的任务。同时，Qwen-7B也实现了全面升级，核心指标最高提升22.5%。

Qwen-14B-Chat体验地址：https://modelscope.cn/studios/qwen/Qwen-14B-Chat-Demo/summary

9、Meta 准备推出具有个性的 AI 聊天机器人

Meta 最快将于本周在其各社交媒体应用中发布具有鲜明个性的 AI 聊天机器人，以此吸引年轻用户。AI 机器人正在内部测试，Meta 预计会在周三开始的 Meta Connect 会议上宣布首批 AI 智能体(AI agent)。这些机器人将用来推动用户的参与，不过其中一些机器人也可能拥有与生产力相关的技能，比如帮助完成编码或其他任务的能力。Meta 正计划开发几十个 AI 个性聊天机器人。该公司还在开发一款产品，让名人和创作者可以使用自己的 AI 聊天机器人与粉丝和追随者互动。

10、芬兰囚犯帮助训练大模型

AI 模型需要大量“点击工人”对数据进行训练，比如教 AI 区分行人和棕榈树，或者组合描述暴力或性虐待的词语。“点击工人”通常来自低工资的南半球国家。比如 OpenAI 雇佣的一家外包公司在肯尼亚、乌干达和印度招募“点击工人”。但南半球国家懂芬兰语的很少。因此芬兰 AI 创业公司 Metroc 找到了监狱劳工帮助它训练大模型。40 多岁的女囚 Marmalade 就成为了一名“点击工人”，她的时薪为 1.54 欧元，轮班时间为 3 小时。芬兰以其开放式监狱闻名——囚犯可以在附近城镇工作或学习。但还有部分监狱是封闭式的，关押重刑犯。Marmalade 被判了 6 年，在一个终身监禁囚犯关押 12 年后可申请释放的国家，6 年是一个重刑。（来源）

11、开源可商用的中文版Llama 2发布

据量子位报道，现在，15小时、几千块钱、85亿Tokens数据，即可训练出中文版Llama 2。Colossal-LLaMA-2近期把大模型门槛打下来了，同时开源团队还提供了一个完整的评估体系框架ColossalEval，以实现低成本的可复现性。这一模型综合性能达到开源社区同规模从头预训练SOTA模型水平。方案完全开源，包括全套训练流程、代码及权重；而且无商业限制，还可迁移应用到任意垂类领域和从头预训练大模型的低成本构建。

GitHub地址：https://github.com/hpcaitech/ColossalAI

12、6.7k Star量的vLLM出论文助大模型低成本部署

据机器之心报道，今年六月，来自加州大学伯克利分校等机构的一个研究团队开源了vLLM，其使用了一种新设计的注意力算法PagedAttention，可让服务提供商轻松、快速且低成本地发布LLM服务，该团队宣称vLLM能实现比HuggingFace Transformers高24倍的吞吐量。现在离vLLM最初宣布时差不多已过去三个月，他们终于发布了这篇关于vLLM和PagedAttention的研究论文，其中详细解释了他们如何通过类似操作系统虚拟内存管理的机制来实现高效的LLM服务。该论文已被将于十月底在德国举办的ACM操作系统原理研讨会（SOSP 2023）接收。

论文地址：https://arxiv.org/abs/2309.06180

代码地址：https://github.com/vllm-project/vllm

文档地址：https://vllm.readthedocs.io

13、恒生电子大模型LightGPT开启内测

今日，恒生大模型产品已面向20家金融机构开启内测。据悉，恒生金融行业大模型LightGPT是专为金融领域打造的大语言模型，它通过训练海量金融数据，对金融相关问题有更好的理解能力。光子是基于LightGPT的智能应用服务，可以为金融机构的各个业务系统注入AI能力，包括投资合规、投顾、客服、运营、投研和交易等。

体验地址：www.hs.net/lightgpt

14、全球最大商业图库 Getty Images 将推出图片生成工具，允许用户利用授权图片进行训练

据 The Verge 报道，全球最大的商业图库 Getty Images 将与英伟达合作推出生成式 AI 工具，它的名字也很直白：Generative AI by Getty Images（Getty Images 的生成式 AI）。据介绍，这款工具允许用户在 Getty Images 庞大的图库中进行训练，也意味着任何使用这种工具、商业发布该工具创作图片的人都会受到法律保护。此外，Getty Images 使用了英伟达生成式 AI 模型库 Picasso 上提供的模型“Edify”来开发这款工具。（来源：IT之家）

15、GitHub 首席执行官 Thomas Dohmke：AI 无法取代程序员

据外媒 TechCrunch 报道，GitHub 首席执行官 Thomas Dohmke 最近在 TC Disrupt today 活动中分享了他对于人工智能和软件开发之间关系的看法。Thomas Dohmke 认为，在 Copilot 及其相关 Copilot Chat 等辅助工具的推动下，人工智能和软件开发现在已密不可分，凭借这些软件，微软已经将 AI 这一技术扩展到了个人消费者。（来源：IT之家）

[t-success icon='']AI·新创[/t-success]

1、开放API进军To B，百川智能发布闭源大模型Baichuan2-53B

9月25日，百川智能正式发布了Baichuan2-53B闭源大模型，同时还一并开放了该模型的API接口，正式进军To B领域，开启商业化进程。百川依旧保持着“小步快跑”的模型发布速度。这已是自4月10日成立以来，百川智能发布的第6款大模型，平均下来几乎是每28天推出一个大模型。对比上月初发布的Baichuan1-53B，Baichuan2-53B在数学、逻辑推理等能力上均有显著提升，还在模型幻觉方面表现良好。百川智能称，该模型是“目前国内幻觉问题最低的大模型”。据百川智能，在Baichuan1-53B的基础上，Baichuan2-53B的逻辑推理能力提升了100%，数学能力提升了31%。此外，Baichuan2-53B在语言理解能力、文本创作能力和知识问答能力上，也分别有29%、18%和9%的提升。（来源：36氪）

AI PC装机指南