共计 3816 个字符,预计需要花费 10 分钟才能阅读完成。
AI·快讯
1、图片里的人动起来了,AI 初创公司 Runway 推出“运动笔刷”功能
AI 初创公司 Runway 日前宣布旗下视频生成模型 Gen-2 上线“运动笔刷”功能,官方称该功能的推出代表了模型可控性迎来一个重要里程碑,用户只需在图片中涂抹一个区域或主体,并为其选择一个方向、添加运动强度,运动笔刷就可以为用户的生成添加受控运动。目前这项功能可免费试用,通常为 125 秒的免费额度,一次消耗约 4 秒。同时,该功能支持用户自己提供图片,或者直接使用 Runway 生成的图片。(来源:IT 之家 )
2、美国、英国等 18 个国家签署协议,敦促企业让 AI 更加安全
据路透社报道,美国、英国和其他十几个国家公布了首份关于如何保护 AI 免受流氓行为侵害的详细国际协议,敦促企业打造“设计安全”的 AI 系统。在一份长达 20 页的文件中,18 个国家一致认为,设计和使用 AI 的公司需要以确保客户和公众免受滥用的方式开发和部署。该协议不具有约束力,主要包含一般性建议,例如监控 AI 系统是否被滥用、保护数据免遭篡改以及审查软件供应商。(来源:IT 之家 )
3、沃尔玛推出“识图购物”功能,利用 AI 辨识电视节目内物品并提供购买链接
据沃尔玛官方新闻稿,沃尔玛日前联合串流平台 Peacock,推出一项名为“购买当下”的 AI 服务,主要通过 AI 识别出电视节目画面中的物品,并对比沃尔玛商品目录中类似商品,提供商品链接供消费者直接购买。沃尔玛这次利用 AI 技术辨识电视节目中物体,也是该公司面对 AI 大潮的尝鲜之举,用户在暂停电视节目时,应用界面上就会出现沃尔玛的商品链接,消费者需要使用手机扫描二维码来进入沃尔玛 App 下单购买。
4、711 便利店宣布明年起在日本市场大规模引入 AI:用于分析数据、策划新品、生成广告素材等
据日经新闻报道,711 便利店宣布明年起将在日本市场大规模引入生成式 AI,主要用于分析数据、策划新产品、生成广告素材等用途。日媒声称,在引入 AI 前,日本市场 7-11 需要经过多次会议讨论、并利用问卷或消费者调查,理解当年市场的趋势和消费者偏好后才能推出一系列产品,整个过程大约需耗时 10 个月。为了加快开发效率,该公司设立了自己的云端 AI 模型,据称整合了 OpenAI、Google 和 Stability AI 等生成式 AI,可收集来自顾客销售数据、产品制造商和社区媒体的多方数据,利用 AI 识别消费趋势并推出新商品提案,还能够生成一系列广告素材,降低成本。
5、AI 数学奥林匹克奖宣布
算法交易公司 XTX Markets 发起了总奖金 1000 万美元的 AI 数学奥林匹克奖,支持者包括了 UCLA 教授陶哲轩等人。该挑战基金旨在推动开发能执行数学推理的 AI 模型,鼓励创造出能在数学奥林匹克竞赛中获得金牌的 AI 模型,模型需要公开分享。AI 数学奥林匹克奖的大奖为 500 万美元,颁发给第一位达到金牌标准的 AI 模型。
6、传字节跳动成立新部门 Flow 发力 AI 应用层
据 36 氪今日报道,从多个独立信源处获悉,字节跳动近期成立了一个新的 AI 部门 Flow,技术负责人为字节跳动技术副总裁洪定坤。一位知情人士称,新部门的业务带头人为字节大模型团队的负责人朱文佳。据悉,在字节圈内,Flow 近期发布了活水招聘帖,社会招聘也已经开始一段时间。在帖中,该部门自称是字节跳动旗下 AI 创新业务团队,“目前已经在国内和海外分别上线豆包和 Cici 两款产品,有多个 AI 相关创新产品孵化中”。多位知情人士称,在此次调整中,字节也从飞书、抖音等各个 BU 抽调人选,到这一部门做一款新的 C 端产品。
7、 浪潮信息发布千亿级开源大模型源 2.0
今日,浪潮信息正式发布千亿级开源大模型源 2.0,参数值分别为 1026 亿、518 亿、21 亿。据介绍,源 2.0 在数理逻辑、数学计算、代码生成能力再进化,创新采用 LFA、局部卷积增强注意力机制,可以有效捕捉局部信息和短依赖信息,使得模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质在编程能力。
8、马毅团队提出白盒 Transformer
11 月 24 日,伯克利和香港大学的马毅教授领导的一个研究团队提出新的深度网络架构 CRATE,这是一种白盒 Transformer,不仅能在几乎所有任务上与黑盒 Transformer 相媲美,还具备非常出色的可解释性。基于此,马毅教授还在社交平台 X 上分享了自己的见解:既然当前的 AI 只是在压缩数据,那么就只能学习到数据中的相关性 / 分布,所以就并不真正具备因果或逻辑推理或抽象思考能力。因此,当今的 AI 还算不是 AGI。
9、科学院等提出基于物理引擎的文生视频框架
11 月 21 日,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框架 GPT4Motion。GPT4Motion 结合了 GPT 等大型语言模型的规划能力、Blender 软件提供的物理模拟能力,以及扩散模型的文生图能力,旨在大幅提升视频合成的质量。
10、英美等国 21 机构发布安全 AI 系统开发指南
当地时间 11 月 26 日,美国国土安全部(DHS)网络安全和基础设施安全局(CISA)与英国国家网络安全中心(NCSC)联合发布了《安全 AI 系统开发指南》,为 AI 系统开发人员提供开发过程中的网络安全决策。该指南是与全球其他 21 个机构和部委(涉及 G7 所有成员国)合作制定的,也是全球范围内首次达成的此类共识。该指南涉及 AI 系统开发生命周期中的四个关键领域:安全设计、安全开发、安全部署以及安全运维,每个部分都重点介绍了有助于降低组织 AI 系统开发过程的网络安全风险的注意事项和缓解措施。
指导文件:http://ncsc.gov.uk/files/Guidelines-for-secure-AI-system-development.pdf
11、谷歌发布首个 AI Core 应用更新:管控本地 AI 模型运行
谷歌近日面向 Pixel 8 Pro 手机,发布了 AI Core 应用的首个更新,可以安卓手机本地管理运行 AI 模型。AI Core 是一种后台服务,在设备本地运行后可以为其它应用程序提供 AI 功能。用户可以通过 AI Core 应用程序,管理本地运行的 AI 模型,此外还配有 AICore Persistent 开关,以便于应用程序始终驻留内存,调用 AI 提供永久运行。(来源:IT 之家 )
12、AI 换装新突破:经 100 万张照片训练,解构重建服装准确率 95.7%
科研团队近日研发出 Sewformer AI 系统,在训练 100 万张服装照片之后,具备识别和重建图片中角色服装的能力。Sewformer AI 系统可以分析用户输入的单张图片数据,解构图片中角色所穿着的服装,并成功找出各个部分并聚集起来重构,准确率高达 95.7%,从而让 AI 生成的服装更加真实。研究人员表示这项系统最重要的潜在用途是虚拟现实 / 元宇宙,可以在数字世界中映射和构建头显佩戴者当前的着装情况,并扩展出商城等付费营收模式。(来源:IT 之家 )
13、微软现已为 Win11 画图 App 引入 DALL-E 3 集成
微软现已开始向所有 Windows 11 用户推送集成 DALL-E 3 的“画图”应用。DALL-E 模型是 OpenAI 开发的图片生成模型,此前已在微软 Bing 的图像生成功能中使用。得益于 DALL-E 3,Win11 用户现可利用 OpenAI 的能力生产你需要的 AI 图像,你现在可以通过“共同创作者(Cocreator)”来开启。
14、微软 Win10 / Win11 的 Copilot 侧边栏将迎来新功能:大声朗读和插件支持
消息源 @Leopeva64 在近日发布的推文中表示,大声朗读(Read Aloud)功能在 Edge 浏览器的 Copilot 侧边栏测试之后,即将引入到 Win10、Win11 系统的 Copilot 中。消息源 @Leopeva64 表示,插件和大声朗读这两项功能将会添加到 Windows Copilot 中,目前已经邀请少量用户开始测试插件。(来源:IT 之家 )
15、微软 Copilot“大脑”将升至 GPT-4 Turbo,并提高字符上限
Mikhail Parakhin 近期在 X(推特)平台发布推文,表示团队正在积极改善 Copilot(Bing Chat),在解决某些问题之后,会升级到 OpenAI 的 GPT-4 Turbo 上。Parakhin 还表示在升级 GPT-4-turbo 之后,字符限制数量会进一步扩充,目前最高输入字数为 4000 字。(来源:IT 之家 )
AI·焦点
中国 AI 大模型背后的五大推手,打得不可开交
11 月初,OpenAI 推出的 GPTs 在全球掀起了大模型应用开发潮,对算力产业提出了新要求。更大算力、更低成本、更易开发,成为公有云厂家当下比拼的焦点。要获得头部大模型客户的青睐,国内云厂商还要在商战中展现出自己的不可替代性。随着「百模大战」进入深水区,阿里云、华为云、腾讯云、百度智能云、火山引擎、天翼云等云厂商都亮出了自己的杀手锏……哪一家才是国内第一大模型云服务厂商?(来源: 智东西 )
![post-qrcode](https://pic.gametop10.cn/wp-content/uploads/2023/04/1680444958-weixinG.jpg)