【2023年12月25日AI晚报】苹果发布多模态 LLM 模型 Ferret；昆仑万维“天工SkyAgents”Beta版全网测试

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]
[t-success icon='']AI·新创[/t-success]
- 1、打造办公AI Agents，「AutoAgents」完成数千万元天使轮融资

[t-success icon='']AI·快讯[/t-success]

1、苹果开放 AI 研究成果，发布多模态 LLM 模型 Ferret

苹果公司于 2023 年 10 月与哥伦比亚大学的研究人员合作发布了名为 Ferret（雪貂）的开源多模态 LLM，但当时并没有引起太多关注。许多人工智能社区的人士都错过了 Ferret 的发布，他们对苹果意想不到地进入开源 LLM 领域表示欢迎，尤其是因为苹果传统上被认为是一个“封闭花园”。（来源：IT之家）

2、抖音加码智能搜索，测试“AI 搜”功能

作为国内最受欢迎的短视频平台之一，抖音近日在主 App 内测试了一项新的功能，名为“AI 搜”。这是一种基于人工智能的搜索问答服务，可以为用户提供快速、准确、全面的回答。“AI 搜”功能位于抖音 App 的搜索界面内，与其他搜索服务如商品、团购、用户、视频等并列。用户只需在“AI 搜”内输入相关的问题或信息，就可以得到“AI 搜”通过智能搜索技术为用户生成的回答。回答的内容不仅来源于抖音内的优质视频，还包括第三方网站的信息，并且提供了跳转链接，方便用户查看更多的细节和讲解。此外，“AI 搜”还可以根据用户的问题，给出用户可能感兴趣的相关问题。（来源：IT之家）

3、日本计划成立国家机构，专门调查生成式 AI 安全及相关方面

据 BNN Breaking 报道，日本日前举行 AI 战略会议，宣布计划成立一个国家机构，专门调查生成式 AI 安全及相关方面。日本首相岸田文雄指出，英国和美国等国家研究机构的出现促使日本作出这一决定。拟议的“AI 安全研究所”旨在探索 AI 安全的评估技术并制定确保全面保护的标准。会议还提出了包括 10 项原则在内的指导方针，呼吁企业在开发或使用生成式 AI 时以人为本并保护隐私。其他原则包括确保安全、透明和保障。日本计划在考虑公众意见后于 2024 年 3 月敲定并实施这些措施，这一举措标志着日本致力于促进本国 AI 相关产品的安全开发。

4、印度正测试通过 AI 改善天气预报精度，应对极端气候

据路透社23日报道，印度一位高级气象官员说，随着暴雨、洪水和干旱等极端天气的增加个，印度正在测试试用AI来建立气候模型，以改善天气预报。印度气象局（IMD）使用超级计算机根据数学模型提供预报，将AI与扩大的观测网络结合使用，有助于以更低的成本生成更高质量的预报数据。（来源）

5、美国立法者提交新法案：要求 AI 公司披露受版权保护的训练数据

据外媒 The Verge 本周六（23 日）报道，美国两名立法者提交了一份涉及人工智能的新法案《人工智能基础模型透明法案》，要求基础模型的创建人披露训练数据的来源，以便于原始的版权持有者知道自己的作品被“盗用”。据报道，两名众议员 Anna Eshoo 和 Don Beyer 将指示 FTC（联邦贸易委员会）与美国国家标准与技术研究院合作，制定有关于培训数据透明度报告的规则。（来源：IT之家）

6、微软必应聊天引入 GPT-4 Turbo 模型，部分用户已可免费使用

据 Windowslatest 报道，微软必应聊天的 GPT-4 Turbo 模型近日向部分随机选中的用户免费开放，该模型基于 OpenAI 的最新人工智能技术，能够提供更智能、更流畅、更有趣的聊天体验。此外，微软还计划升级必应聊天的代码解释器功能，使其与 OpenAI 的能力保持一致，这意味着代码解释器将能够处理更复杂的编程或数据问题。（来源：IT之家）

7、昆仑万维“天工SkyAgents”Beta版全网测试

昆仑万维AI Agents开发平台“天工SkyAgents”Beta版正式开放测试，用户可在天工开放平台体验。据介绍，“天工SkyAgents”AI Agents开发平台基于昆仑万维“天工大模型”打造，具备从感知到决策，从决策到执行的自主学习和独立思考能力。用户可以通过自然语言构建自己的单个或多个“私人助理”，并能将不同任务模块化，通过操作系统模块的方式，实现执行包括问题预设、指定回复、知识库创建与检索等任务。

地址：https://model-platform.tiangong.cn

8、微软 Xbox 宣布与 Inworld AI 合作，有望为游戏创造基于人工智能驱动的 NPC

微软 Xbox 游戏 AI 总经理 Haiyan Zhang 日前宣布与数字人开发公司 Inworld AI 签署了一项合作协议，将引入一系列开发工具，允许开发者为游戏创建基于 AI 的 NPC。当前游戏内的 NPC 通常采用预制对话，因此玩家很容易对 NPC 对话内容感到厌倦，微软 Xbox 援引 Inworld 公司内部一项调查，声称有 79% 玩家经常与 NPC 进行互动，但有 28% 玩家认为当前游戏内的 NPC“对玩家的行为难以做出正确的回应”、52% 玩家抱怨现在游戏内的 NPC“只会重复对话”。（来源：IT之家）

9、首个汽车行业中文大模型测评基准发布

据SuperCLUE微信公众号今日发文，SuperCLUE推出了专门针对汽车行业的大模型测评基准（SuperCLUE-Auto）。这是首个汽车行业大模型测评基准，是一个多维度的多轮开放式问题的测评基准。SuperCLUE-Auto包括智能座舱与交互、汽车营销、汽车理解与知识、车辆使用指南4大核心基础能共十余个任务，首批测评选择了国内外有代表性的12个闭源/开源的模型，结果显示，有4个中文大模型在中文的汽车场景的表现超过了GPT-3.5。

榜单地址：cluebenchmarks.com/superclue_auto.html

10、夸克App上线健康大模型应用

今日，夸克App宣布全面升级健康搜索，推出健康大模型应用“夸克健康助手”，并在部分搜索结果和功能板块中上线全新的内容交互方式。升级后，用户在夸克中搜索健康信息的正确率超过行业平均水平。经过精调和知识增强的夸克大模型，以486分的高分通过临床执业医师资格考试，同时在健康内容上的幻觉率已经降低至5%以内。

针对AIGC等全新搜索内容形态，夸克成立了夸克健康专家团，与全国顶级公立三甲医院的专家共建大模型内容生态，确保内容层面的专业性、正确性和科学性。此外，夸克还会招募健康大模型精调师，持续地结合用户需求和热门病症，提供最新的健康知识。目前，夸克已经与200多位权威医学专家、60多家全国知名公立三甲医院和40多家医学机构合作。

11、智源开源代码生成训练数据集与评测基准TACO

智东西12月25日消息，据智源研究院微信公众号今日发文，智源开源了一个专注于算法的代码生成数据集TACO（Topics in Algorithmic COde generation dataset），旨在为代码生成模型领域提供一个更具挑战性的训练数据集与评测基准。该数据集包含难度更大、更接近真实编程场景的编程竞赛题目，强调提升或评测模型在实际应用场景中对问题的理解和推理（Reasoning）能力，而不仅仅是实现既定的函数功能。据悉，TACO包括训练集（25443道题目）和测试集（1000道题目），每个题目都尽可能匹配多样化的解题答案，答案规模高达155万条，每个题目均包含任务主题、算法、技能及难度等细粒度标签，为代码生成模型的训练与评测更精确的参考。经实验，当前流行的代码生成模型在TACO评测中与GPT-4存在显著差异，表明这一领域仍有巨大的提升空间。（来源）

论文地址：arxiv.org/abs/2312.14852

智源开放数据仓库：data.baai.ac.cn/details/BAAI-TACO

[t-success icon='']AI·新创[/t-success]

1、打造办公AI Agents，「AutoAgents」完成数千万元天使轮融资

AutoAgents.ai是一家人工智能技术公司，成立于2023年6月，致力于为全球多个国家和地区的企业提供自主智能体（AI Agents）以及智能助理（Copilot）软件服务，以提高人们的工作效率。AutoAgents.ai（未来式智能）近日完成数千万元天使轮融资，由创新工场领投，共青城七熹投资跟投。本轮融资资金主要用于产品研发，市场拓展以及扩大团队规模等。（来源：36氪）

AI·新世界