【2023年10月30日AI晚报】百川智能推出 Baichuan2-192K 大模型；昆仑万维开源“天工”Skywork-13B系列大模型

文章目录[隐藏]

[t-info icon='']AI·快讯[/t-info]
[t-info icon='']AI·新创[/t-info]
- 1、「未来盒子」获天使+轮、Pre-A轮融资，用AIGC的方式重做家居行业
- 2、「卓视智通」获数千万Pre-B+轮融资，加快推进AI视觉大模型研发和应用落地

[t-info icon='']AI·快讯[/t-info]

1、百川智能推出 Baichuan2-192K 大模型，上下文窗口长超 GPT-4 约 14 倍

百川智能今日宣布推出 Baichuan2-192K 大模型。据介绍，该模型上下文窗口长度达 192K，能够处理约 35 万个汉字，号称是目前全球最长的上下文窗口。百川智能表示，Baichuan2-192K 是目前支持长上下文窗口最优秀大模型 Claude2（100K 上下文窗口，实测约 8 万字）的 4.4 倍，是 GPT-4（支持 32K 上下文窗口，实测约 2.5 万字）的 14 倍。百川智能表示，Baichuan2-192K 将以 API 调用和私有化部署的方式提供给企业用户，目前百川智能已启动 Baichuan2-192K 的 API 内测，开放给法律、媒体、金融等行业的核心合作伙伴。

地址：https://www.baichuan-ai.com

2、花旗计划为其40000多名程序员部署生成式AI

据报道，随着华尔街继续拥抱人工智能这项新兴的技术，花旗集团（Citigroup）计划为其4万多名程序员中的绝大部分使用生成性人工智能（GAI）。作为小型试点项目的一部分，花旗集团开始允许大约250名开发人员率先体验生成式人工智能。明年，花旗集团计划将该计划扩展到绝大多数程序员。其实，在ChatGPT发布后不久，花旗集团就着手研究如何使用这项新兴的技术。公司联席首席信息官（CIO）Stuart Riley表示，作为回应，花旗集团今年早些时候成立了两个特别工作组，探索这项技术的潜在用途。（来源：新浪财经）

3、前苹果员工创立，Humane 下月发布无屏幕 AI 可穿戴设备 Ai Pin：内置 ChatGPT

据 The Information 报道，由两位苹果公司的前设计和工程团队高管创立的 Humane 公司将于 11 月 9 日发布首款可穿戴设备 ——Ai Pin。据介绍，这是一种基于服装的可穿戴设备，没有屏幕，大小与一块饼干差不多。该设备还将配备一个摄像头、一个麦克风和扬声器，以及各种传感器和激光投影仪，用户可用磁铁将其吸附在衣服上。该设备将配备高通骁龙芯片，号称拥有智能手机级别的速度、连接性、摄像功能和安全性。（来源：IT之家）

4、全国通用人工智能行业产教融合共同体在北京门头沟成立

据“北京门头沟”公众号报道，全国通用人工智能行业产教融合共同体成立大会暨人工智能产业人才培养论坛在北京市门头沟区京西智谷・智能文创园召开。全国通用人工智能产教融合共同体由中关村科技园区门头沟园管理委员会、北京航空航天大学、中国电子技术标准化研究院、北京工业职业技术学院等单位联合发起成立，共有 25 个省份超 200 个机构参加。据介绍，门头沟区在今年 5 月已发布北京首个人工智能算法领域专门人才政策，落地首个自主创新人工智能技术人才培养体系。（来源：IT之家）

5、七国集团将就企业开发先进 AI 系统行为准则达成一致

一份文件显示，七国集团（G7）将于周一就开发先进人工智能（AI）系统的公司的行为准则达成一致，此举正值各国政府纷纷寻求减轻这项技术的风险和潜在的滥用。该文件显示，考虑到人工智能可能带来的隐私和安全风险，这套自愿行为准则将成为一些主要国家管理人工智能的重要里程碑。（来源：新浪财经）

6、ChatGPT 测试新功能：可自动根据上下文选择相关工具使用

OpenAI 目前正在为 ChatGPT Plus 会员推出新的测试版功能，有用户反馈，这次更新包括了上传文件和处理文件的能力，以及多模态支持。这意味着用户不需要从 GPT-4 的下拉菜单中选择像 Browse with Bing 这样的模式，而是根据上下文自动猜测用户想要做什么。（来源：IT之家）

7、拒绝英伟达一家独大，消息称甲骨文正采购 AMD Instinct MI300X AI 芯片

根据瑞银一份调查报告，甲骨文 (Oracle) 的云基础设施正面临 GPU 供应限制，而不是人工智能需求的限制，这可能会影响其近期增长潜力。为了解决 Nvidia GPU 供应不足的限制，甲骨文表示，他们不会追求专有的芯片计划，而是专注于 AMD MI300X 芯片，并计划在“明年初”推出这些芯片。（来源：IT之家）

8、OpenAI 首席科学家：总有一天人类会选择与机器融合

据《麻省理工科技评论》，OpenAI 的联合创始人兼首席科学家 Ilya Sutskever 近日接受采访，谈及公司及 AI 行业的未来发展。Ilya Sutskever 表示，当前他的首要任务并非制作“下一个 GPT 或 DALL-E”，而是研究如何阻止“超级 AI”的失控。他还认为 ChatGPT 可能是有意识的，世界需要清醒地认识到 AI 真正的力量。“总有一天，人类会选择与机器融合。”（来源：IT之家）

9、谷歌 Bard 聊天机器人升级，可实时生成回复

谷歌现在为 Bard 提供了一个“实时响应”的选项，让回复感觉更快速。开启该选项后，回答在进行中时就会实时显示，文字就会一行一行地出现。如果不想让 Bard 实时回答你的问题，仍然可以从右上角的齿轮图标中切换“实时回复”和“完成后回复”的选项。谷歌 Bard 还允许用户修改回复的风格，让它变得更“随意”或者更“专业”，而且还可以通过点击底部菜单栏的谷歌标志来对照搜索中的信息来核对任何答案。（来源：IT之家）

10、昆仑万维开源“天工”Skywork-13B系列大模型

昆仑万维今日宣布开源百亿级大语言模型「天工」Skywork-13B 系列，并配套开源了 600GB、150B Tokens 开源中文数据集。昆仑万维「天工」Skywork-13B 系列目前包括 130 亿参数的两大模型：Skywork-13B-Base 模型、Skywork-13B-Math 模型。除模型开源外，Skywork-13B 系列大模型还将开源 600GB、150B Tokens 的中文语料数据集 Skypile/Chinese-Web-Text-150B，号称是目前最大的开源中文数据集之一。同时，昆仑万维「天工」Skywork-13B 系列大模型即将全面开放商用 —— 开发者无需申请，即可商用。

Skywork-13B 下载地址（Model Scope）：https://modelscope.cn/organization/skywork

Skywork-13B 下载地址（Github）：https://github.com/SkyworkAI/Skywork

11、360 与航天宏图达成战略合作：在气象、水利等领域打造人工智能方案

日前，360 集团宣布与航天宏图达成战略合作。未来，双方将依托自身优势，在行业大模型落地探索和数字安全赋能等方面开展深入合作。据介绍，双方将在卫星遥感大模型探索上展开深入合作，在气象、应急、水利等领域打造可落地的人工智能产品方案。此外，双方还将结合各自的核心技术优势，在城市安全、卫星互联网安全、重点行业数字化安全等方向开展深入合作。（来源：IT之家）

12、哔哩哔哩：全年 “AIGC” 相关视频播放量 90 亿，“上万名科研工作者”站内跟进科普

哔哩哔哩日前在“bilibili 超级科学晚”活动中，公布了一则“五大科学焦点榜单”，主要涉及站内有关“AIGC、室温超导、脑机接口、黑洞、可控核聚变”等关键词的视频数据情况。哔哩哔哩表示，过去一年有 2.43 亿用户在站内进行学习，是中国在校大学生人数的 5.5 倍。全站泛知识内容消费人群中，有 72% 为 00 后。在科学和知识品类方面，相关视频占哔哩哔哩用户搜索排名第 2 位，相关内容播放量占站内 41%，00 后正在成为科学内容消费主力，其中全年 “AIGC” 相关视频播放量 90 亿，播放时长达 140 亿分钟。（来源：IT之家）

13、阿里通义千问大模型 App 上线：支持 AI 问答、创意文案等功能

日前，阿里云旗下大模型通义千问 App 现已上架各大安卓应用市场，版本号为 1.0.2，安装包大小为 40.95MB。应用介绍显示，通义千问是一款超大规模预训练模型，能够在创意文案、办公助理、学习助手、趣味生活等多个方面为用户提供全方位的协助。据介绍，通义千问 App 在创意文案方面可提供小红书文案生成、剧本创作、改写润色等功能；办公助理可提供代码生成、代码解释、周报扩写等；学习助手可提供中英互译、数学题、文言文翻译等功能；趣味问答支持高情商回复、吹彩虹屁、健身计划等。

地址：https://tongyi.aliyun.com

14、智子引擎发布多模态大模型元乘象Chatimg3.0

据元乘象微信公众号发文，10月28日，AI创企智子引擎发布超精细识别、少幻觉的多模态大模型“元乘象Chatimg3.0”，支持多图理解、物体定位、OCR等功能。与Chatimg2.0相比，Chatimg3.0主要升级了两个方面，包括第一阶段的预训练（描述、检测、OCR等多任务训练）以及第二阶段的指令微调（高质量的人工精筛指令集）。据称，Chatimg3.0在问答和业务两个方面的能力上赶超GPT-4V，目前已应用于全域防控和无人机巡检等领域，实现了AI缺陷识别、异常检测、行为分析、重点监控、自主巡查、风险预测等功能。

体验地址：https://www.chatimg.cn/pages/chatroom/chatroom

15、万兴科技发布AI视频创作软件Filmora 13

据万兴科技微信公众号发文，10月29日，万兴科技发布AI视频创作软件Wondershare Filmora 13。据介绍，Wondershare Filmora 13内置创作助手Copilot，可根据自然语言提供创作建议和指导。Wondershare Filmora 13还上线了AI文本成片、AI音乐生成器等AI生成功能，以及AI文字快剪、智能人声分离、AI智能遮罩等AI智能编辑功能，支持用户在手机端、平板端、PC端之间共享文件、逐帧审阅视频和自动同步编辑元素。面向国内市场，万兴科技多端同步升级了“万兴喵影2024”，在国内率先上线AI文字快剪、智能人声分离、AI智能遮罩、AI智能补帧等AI创作功能。

地址：https://filmora.wondershare.com

16、苹果研究团队提出俄罗斯套娃式扩散模型MDM

据机器之心报道，10月23日，苹果研究团队提出俄罗斯套娃式扩散模型（Matryoshka Diffusion Models，MDM），用于端到端高分辨率图像生成。该研究提出的主要观点是将低分辨率扩散过程作为高分辨率生成的一部分，通过使用嵌套UNet架构在多个分辨率上执行联合扩散过程，可以训练分辨率达1024×1024像素的单像素空间模型。

论文地址：https://arxiv.org/pdf/2310.15111.pdf

17、中科大等提出大模型免重训架构幻觉降低30%

10月24日，中科大和腾讯优图实验室研究人员合作发表了一篇论文，提出一个免重训、即插即用的通用架构“啄木鸟”（Woodpecker），直接从模型给出的错误文本下手，“倒推”出可能出现“幻觉”之处，然后与图片确定事实，最终直接完成修正。据悉，该架构是业内第一个无需重新训练模型就能解决“幻觉”的全新办法，成功将MiniGPT-4的准确性从54.67%提高到了85.33%，将mPLUG Ow的准确性从62%提到了86.33%。

Woopecker论文地址：https://arxiv.org/abs/2310.16045

Woopecker代码地址：https://github.com/BradyFU/Woodpecker

18、英伟达等提出机器人自主数据生成系统MimicGen

10月26日，英伟达与得克萨斯大学奥斯汀分校发表论文，提出一个名为“MimicGen”的系统，该系统只需少量人类示范，便能自动生成大规模的机器人训练数据集。研究团队称，利用MimicGen，他们从不到200个人类演示中自动生成了超过50000个演示，涉及18个任务、多个模拟器和现实世界。

项目主页：https://mimicgen.github.io

论文地址：https://arxiv.org/abs/2310.17596

19、斯坦福等提出新的Transformer替代技术

斯坦福大学和纽约州立大学布法罗分校的一个研究团队近日发布了一篇论文，提出Transformer的替代技术Monarch Mixer，并公开了一些检查点模型及训练代码。该方法去掉了Transformer中高成本的注意力和MLP，代之以富有表现力的Monarch矩阵，使之在语言和图像实验中以更低的成本取得了更优的表现。

论文地址：https://arxiv.org/abs/2310.12109

代码地址：https://github.com/HazyResearch/m2

20、百度文心一言专业版开启邀测：每日早上 9 点申请，可体验文心大模型 4.0

百度文心一言专业版开启邀测活动，点此进入官网，每日早上 9 点开始申请，名额有限，领完即止。如成功获得邀测名额，官方将在当日发送短信通知，邀测权限将直接发放至账号，可体验文心大模型 4.0。邀测权限自邀测名额发放之日起 30 天内有效。活动时间：10 月 28 日-31 日。

[t-info icon='']AI·新创[/t-info]

1、「未来盒子」获天使+轮、Pre-A轮融资，用AIGC的方式重做家居行业

「未来盒子」由百变空间创始人白轶峰和房盒子软件创始人黄晓攀于2021年联合创立。作为一家年轻的公司，「未来盒子」的创始团队有着20年以上的行业经验，依托自主开发的BIM系统，自主研发的高性价比的快装产品，为用户提供一站式的现代化装修解决方案。据介绍，「未来盒子」旗下数字化产品BIM设计软件，结合AI+BIM技术，以创新式文字生成3D场景、模型的方式，能将描述性的文本转化为相应的3D模型，帮助企业设计师快速生成家居设计方案，并支持VR效果图、装配式部品计算、报价清单、订单算量一键生成。（来源：36氪）

2、「卓视智通」获数千万Pre-B+轮融资，加快推进AI视觉大模型研发和应用落地

卓视智通成立于2012年，是一家基于AI的视频融合感知及车路协同解决方案提供商。据介绍，与同期创立的大多数聚焦计算机视觉（CV）领域的人工智能公司不同，卓视智通在成立之初就将智慧交通作为目标市场，并选择从路端而非车端切入。具体而言，卓视智通主攻车型识别、行人识别、交通场景识别、交通视频分析和数字孪生技术的原创研发，以及AI技术在交通及安全垂直行业的应用落地。通过实现车、路、人、环境的融合感知识别，公司旨在为监管部门、道路管理者提供平台及数字化工具。同时，卓视智通也正加快向车端场景拓展业务，以面向车主、自动驾驶汽车厂商提供实时信息服务。（来源：36氪）

AI PC装机指南