【2023年10月26日AI晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

227次阅读
没有评论

共计 5564 个字符,预计需要花费 14 分钟才能阅读完成。

AI·快讯

1、百川智能 CEO 王小川:大模型是将语言变成数学模型,掌握背后的规律

百川智能 CEO 王小川表示,从技术上来说,语言感知比图片视频感知更难,同时智力并不是逻辑推理,而是一种抽象和比喻的能力。他打比方称,牛顿曾用三大定律把万物之间的规律变成了数学问题,这对于人类而言是巨大的进步。今天的大模型也是将语言变成数学模型,一旦掌握了语言的规律就意味着掌握了背后的知识、思考、沟通和文化。

2、亚马逊推出人工智能图像生成功能

10 月 25 日,亚马逊宣布推出测试版图像生成功能。亚马逊称,在亚马逊广告控制台中,广告商只需选择产品并点击“生成”,该工具就能利用人工智能生成功能,根据产品细节在几秒钟内提供一组以生活方式和品牌为主题的图片。Amazon Ads 主要协助 Amazon 上注册的卖家、供应商、书商、出版商、程式开发者或广告代理商张贴广告,广告的曝光平台包括 Amazon 与其它网站,此一图像生成工具仍处测试阶段,目前仅供特定广告主试用,未来也会扩大测试范围。

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

3、谷歌 CEO 皮查伊:正考虑为新的 AI 产品采用订阅模式

在 2023 年第三季度财报电话会议上,谷歌及其母公司 Alphabet 首席执行官桑达尔・皮查伊(Sundar Pichai)表示,该公司可能会在某些新的人工智能(AI)产品中采用订阅模式。在此次会议上,美国投行摩根士丹利分析师布莱恩・诺瓦克(Brian Nowak)询问了谷歌在人工智能搜索领域的投资,以及华尔街应该如何看待这些投资带来的未来回报。(来源: 网易科技

4、纳德拉出席高通骁龙峰会,称 Copilot 将成为下个 Windows 开始按钮

高通在昨日开幕的骁龙峰会上,正式推出了 X Elite 处理器,并公布了 9 家首批合作伙伴。在本次活动中,微软现任首席执行官萨蒂亚・纳德拉(Satya Nadella)、Windows + Devices 部门副总裁帕万・达武鲁里(Pavan Davuluri)也出席活动,现场讨论了骁龙 X Elite 和 NPU 对未来 Windows 的影响。(来源:IT 之家

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

5、谷歌 Play 公布新规:AI 应用禁止生成受限内容,明年开始实施

随着人工智能(AI)功能在 App 层面开启大规模应用,谷歌 Play 应用商店也发布了新规来应对这一情况。谷歌今日宣布更新开发者政策,特别是围绕生成性人工智能的主题。该公司表示,明年初,平台将要求开发者在应用程序内提供“报告或标记攻击性人工智能生成内容”的功能。谷歌表示,它希望开发者使用这些报告来告知他们应用程序中的内容过滤和审核。此外,开发者将需要遵循谷歌的指导方针,禁止和防止生成受限内容,谷歌提供的一些例子包括任何描述虐待儿童的内容等。(来源:IT 之家

6、微软 CEO 纳德拉称 AI 诞生堪比原子能,需要展开全球治理

微软现任首席执行官萨蒂亚・纳德拉(Satya Nadella)认为,人工智能(AI)的出现不亚于原子弹,呼吁全球加强监管。纳德拉近日前往 Axel Springer 总部,领取 2023 年 Axel Springer 奖,在颁奖活动中,他接受了 Axel Springers 首席执行官 Mathias Döpfner 的采访。在采访中纳德拉表示:“我认为人工智能(AI)有必要进行一定程度的全球治理,而在治理过程中必然也会伴随着一些竞争。如果我们想要形成一个成功的人工智能监管机制,需要像国际原子能机构那样展开全球合作。”(来源:IT 之家

7、阿里国际站外贸 AI 生意助手上线

阿里巴巴国际站的外贸 AI 产品“生意助手”将于 11 月 1 日上线,向所有商家开放。内测数据显示,AI 生意助手能帮外贸商家提升约 19% 的曝光量。

8、腾讯:已有超过 180 个业务接入腾讯混元大模型

10 月 26 日,腾讯宣布,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能。据介绍,目前已有超过 180 个内部业务接入腾讯混元大模型,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。今年 9 月首批通过备案后,腾讯混元大模型也已经面向 C 端用户陆续开放体验。

9、快手内测“AI 小快”,可借助快意大模型在评论区实现智能回复

10 月 26 日,快手正式内测“AI 小快”账号,在短视频评论区为用户提供互动问答、图片生成、攻略检索、文案修改等多种基于短视频应用场景的 AIGC 服务。据了解,“AI 小快”采用快手从零到一独立自主研发的大规模语言模型“快意”大模型作为基座。

10、小 i 华藏通用大模型生态正式开启

小 i 机器人华藏通用大模型生态正式开启。据介绍,华藏生态以 1 个能力基座(华藏通用大模型)、1 个产品支撑(华藏开发者平台)、3 项服务保障(培育、市场和投资)为支撑,在智慧金融、智能服务、ISV、IoT 等领域达成商业变现。

11、扎克伯格:明年 AI 将成 Meta 最大投资领域,人力将向 AI 集中

在 2023 财年第三季度财报电话会上,Meta CEO 扎克伯格强调,相信生成式 AI 的相关技术将让人们使用各种应用程序的方式变得更有意义,在未来,Meta 甚至有可能会利用 AI 来根据用户的兴趣为他们直接生成内容。对于公司的后续发展,扎克伯格表示在 2024 年,就工程和计算资源而言,AI 将成为 Meta 最大的投资领域。此外,扎克伯格补充道,为了避免布置大量的新员工,公司将降低一些非 AI 项目的优先级,并将相关人员转向从事 AI 工作。(来源: 澎湃

12、英特尔拓展 AI 软件业务,帮助客户开发“自研 ChatGPT”

The Information 报道称,随着英特尔在人工智能热潮中受益,该公司正在尝试更多 AI 领域的东西,例如销售人工智能软件和服务。对于这家美国芯片制造商来说,这是一个罕见的举动,特别是因为它的软件并非捆绑硬件,这意味着其客户无论是否使用英特尔芯片都不会产生影响。(来源:IT 之家

13、腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

据“鹅厂技术派”消息,腾讯混元大模型近日迎来全新升级,并正式对外开放“文生图”功能。官方宣称,升级后的腾讯混元中文效果整体超过 GPT3.5,代码能力大幅提升 20%,达到业界领先水平。(来源:IT 之家

地址:https://hunyuan.tencent.com

据介绍,大模型文生图的难点体现在对提示词的语义理解,生成内容的合理性以及生成图片的效果,针对这三个技术难点,腾讯进行了专项的技术研究,提出了一系列原创算法:

  • 在语义理解方面,腾讯混元采用了中英文双语细粒度的模型,模型同时建模中英文实现双语理解,而不是通过翻译, 通过优化算法提升了模型对细节的感知能力与生成效果 ,有效避免多文化差异下的理解错误。

  • 在内容合理性方面,AI 生成人体结构和手部经常容易变形。混元文生图通过增强算法模型的图像二维空间位置感知能力,并将人体骨架和人手结构等先验信息引入到生成过程中,让生成的图像结构更合理,减少错误率。

  • 在画面质感方面,混元文生图基于多模型融合的方法,提升生成质感。经过模型算法的优化之后,混元文生图的人像模型, 包含发丝、皱纹等细节的效果提升了 30%,场景模型,包含草木、波纹等细节的效果提升了 25%。

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

14、Jina AI 推出全球首个开源 8K 文本嵌入模型,号称“超越 OpenAI”

Jina AI 在其官网发布新闻稿,宣布推出 jina-embeddings-v2 模型,号称是目前是唯一支持 8K(8192 个 token)上下文长度的开源产品,在功能和性能上与 OpenAI 的 text-embedding-ada-002 类似。官方表示,jina-embeddings-v2 模型,是从头开始构建的。在过去的三个月里,Jina AI 团队进行了密集研发、数据收集和调整。(来源:IT 之家

地址:https://jina.ai/news/jina-ai-launches-worlds-first-open-source-8k-text-embedding-rivaling-openai

15、用友大易 TRM.AI2.0 宣布正式上线

近日,用友大易 TRM.AI2.0 宣布正式上线。据介绍,用友大易 TRM.AI2.0 依托 YonGPT 用友企业服务大模型,将 AI 技术落地于人才发现、智能面试、咨询问答等多种招聘应用场景。

16、WPS AI 亮相小米 14 发布会,推出“一键生成 PPT”“随手拍”等功能

10 月 26 日,WPS AI 在小米 14 系列手机新品发布会上亮相。据介绍,在此次的新品研发中,小米与 WPS 达成深度合作,邀请用户申请体验全新的移动智能办公。WPS AI 具有“一键生成 PPT”“随手拍”等功能,小米 14 系列手机用户可下载体验。

17、为“评估测试最有能力的 AI 模型”,微软联合 OpenAI、谷歌等公司设立 1000 万美元安全基金

据 OpenAI 官网新闻稿,目前微软联合 OpenAI、谷歌、Anthropic 公司发布联合声明,将设立 1000 万美元的 AI 安全基金,主要用于推动 AI 评估研究,帮助社会能够有效地测试和评估“最有能力的 AI 模型”。这一 AI 安全基金将支持来自世界各地附属于学术机构、研究机构和初创公司的研究人员。初始资金来自 Anthropic、谷歌、微软和 OpenAI,以及其他慈善合作伙伴。这项安全基金旨在支持外界开发新的模型评估技术,“我们相信,增加该领域的资金将有助于提高安全标准,并为行业、相关部门和民间社会应对 AI 系统带来的挑战所需的缓解和控制提供见解。”

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

18、小米澎湃 OS 将 AI 大模型植入系统,率先支持 NPU 部署

小米澎湃 OS 暨 Xiaomi 14 系列新品发布会正在进行中,IT 之家为大家带来全程视频直播。在今日的发布会上,金凡带来了全新的小米澎湃 OS。据介绍,小米将 AI 大模型植入系统,还有小爱输入助手,支持 AI 创作文本,一键直达。此外,小米澎湃 OS 还支持 WPS 随手拍,可以直接用拍照的方式记录文本,小米澎湃 OS 可秒懂文意。(来源:IT 之家

19、 智源悟道·天鹰 Aquila2-34B 开源 v1.2 新版本

据智源社区微信公众号发文,今日,智源悟道·天鹰 Aquila2-34B、AquilaChat2-34B 开源最新权重 v1.2 版本,相较于 10 月 12 日开源的 v1.0,Base 模型综合客观评测提升 6.9%,Chat 模型在主观评测的 8 个二级能力维度上,均接近或超过 GPT3.5 水平。

悟道·天鹰 Aquila2 开源仓库:https://github.com/FlagAI-Open/Aquila2

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

20、SuperCLUE 中文大模型测评基准 10 月榜单发布

据 CLUE 中文语言理解测评基准微信公众号发文,10 月 25 日,SuperCLUE 发布中文大模型 10 月榜单。本次评测主要考察模型在中文能力上的表现,包括专业知识技能、语言理解与生成、AI 智能体和安全四大能力维度的上百个任务,选取了目前国内外最具代表性的 20 个通用大语言模型。与 9 月相比,新增了月之暗面的 Moonshot、百度的文心一言 4.0、科大讯飞的星火 V3.0、vivo 的 vivoLM 和阿里云的 Qwen-14B。SuperCLUE 通过本次评测发现,国内第一梯队大模型格局已基本形成,头部几个中文大模型已经与 GPT3.5 极为接近,但与 GPT4 的距离依然遥远。

榜单地址:https://www.superclueai.com

官网地址:https://www.cluebenchmarks.com

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

21、复旦团队发布中文智慧金融系统 DISC-FinLLM

据机器之心报道,10 月 25 日,复旦大学数据智能与社会计算实验室(FudanDISC)发布金融领域大语言模型 DISC-FinLLM,开源了模型参数并开放 Demo 试用。据悉,DISC-FinLLM 是一款专为金融领域设计的领域大模型,具备处理众多金融场景的多样化需求能力,包括但不限于金融情感分析、金融关系提取、政策查询与分析、多轮对话、统计分析、金融模型、实时金融信息检索和金融计算等方面。

主页地址:https://fin.fudan-disc.com

论文地址:http://arxiv.org/abs/2310.15205

GitHub 地址:https://github.com/FudanDISC/DISC-FinLLM

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

22、Bengio、Hinton 等 24 位专家联名呼吁 AI 风险管理

当地时间 10 月 24 日,Bengio、Hinton、姚期智、张亚勤等知名 AI 领域专家发布了一封联名信,呼吁 AI 风险管理。文中提到,在 AI 的快速发展中,本文作者对即将到来的强大 AI 系统的大规模风险达成了共识。他们呼吁在开发这些系统之前,采取紧急治理措施,并在 AI 研发中向安全和道德实践进行重大转变。

原文地址:https://managing-ai-risks.com

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

23、Midjourney 新网站上线测试版

当地时间 10 月 24 日,Midjourney 宣布推出新网站并正在进行重大更新。新网站目前已上线测试版,官方称该网站比以前快得多,具备新的灯光模式、新灯箱、新的个人搜索等。

Midjourney 新网站地址:https://beta.midjourney.com

24、上海 AI 实验室推出通用 3D 模型 PonderV2

据上海 AI 实验室微信公众号 10 月 24 日发文,近日,上海 AI 实验室联合香港大学、浙江大学和中国科学技术大学共同推出 PonderV2 通用 3D 预训练方法与模型,同时开源代码。PonderV2 具有深度理解和感知三维真实世界的能力,并为广泛的三维应用提供强大支持。Ponder 系列在通用 3D 方面实现三个“首次”:首次同时支持室内外使用场景;首次同时支持点云、体素和多视角图像输入;首次在不同语义层级的下游任务上达成最佳性能。

论文地址:arxiv.org/abs/2310.08586

开源地址:github.com/OpenGVLab/PonderV2

【2023 年 10 月 26 日 AI 晚报】亚马逊推出人工智能图像生成功能;腾讯混元大模型现已支持“文生图”功能,将陆续向用户开放

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-10-26发表,共计5564字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。