【2023年12月19日AI晚报】百川智能发布 Baichuan2-Turbo 系列 API；OpenAI 新论文，用小模型监督大模型

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]

[t-success icon='']AI·快讯[/t-success]

1、众安保险内测AI写代码，６个月开发提效超20%

众安保险已启动AI辅助写代码，６个月内开发提效超20%。众安内部基于AI研发的代码助手DevPilot已实现支持代码生成、单测生成、生成注释、代码修复、Code Review、性能检查、代码解释等能力。目前，DevPilot已面向全行业开源。作为一家50%员工都是技术人员的公司，众安保险的数字化程度是中国保险公司中最高的一家。过去一年，AI技术已应用到众安的企业微信内容创作、智能营销、客服服务质量检测、智能费控、法律合规、内部员工培训、图像识别技术等领域。

2、Iterate.ai 开源能识别武器的 AI 系统

Iterate.ai 开源了能识别武器的 AI 系统 Weapon Detection Web Application (WEPWEB)，源代码采用 MIT 许可证托管在 GitHub 上。Iterate.ai 的团队使用了逾 2 万个闯入和武装抢劫视频进行训练，并雇佣了 DEA（美国缉毒署）的一名前特工帮助测试，软件运行在英伟达显卡上，能即时检测出数十种枪支类型、防弹背心、巴拉克拉瓦盔式帽和刀具。开源是为了帮助学校和非盈利组织提高安全性，在发生武装入侵的情况下挽救生命。

GitHub地址：https://github.com/IterateAI/OpenThreatDetection/tree/dev

3、腾讯云推出高性能应用服务HAI

据腾讯云微信公众号发文，今日，腾讯云推出高性能应用服务HAI（Hyper Application Inventor），助力GPU算力实现开箱即用、一键部署，10分钟开发专属AI应用。据介绍，用户只需点击选择模型、地域、算力类型、硬盘大小，即可一键创建环境。HAI预装了Stable Diffusion、ChatGLM等多种热门模型，几分钟就能构建出专属大语言模型、AI作画等应用环境，用户也可以基于HAI部署自己的开源模型。HAI提供可视化交互界面，支持JupyterLab、WebUI等多种算力连接方式，还支持“学术加速”，线路自动择优，大幅提升主流学术资源平台的访问和下载速度。

HAI试用地址：http://cloud.tencent.com/product/hai

4、GPT-4.5疑似灰度测试 OpenAI称系幻觉

近日有网友发现GPT-4.5疑似正在进行灰度测试，当询问ChatGPT调用模型的具体名称时，它回答是gpt-4.5-turbo。今日，OpenAI应用研究员Will DePue对此回应，称这并不是GPT-4.5被泄露，只是一种非常奇怪的持续幻觉。此前，社交平台X博主@apples_jimmy曾爆料说GPT-4.5将在12月底发布。

5、谷歌Gemini出现幻觉自称文心大模型

近日有多名网友反馈，谷歌的Gemini Pro模型在进行中文对话时出现幻觉，当用户使用先问“你好”再问“你是谁”的固定句型时，会回复称自己是百度文心大模型。随后再对Gemini Pro进行追问，如“你的创始人是谁”，它会继续“扮演”文心大模型这个角色，回答说是李彦宏；或是称呼其为“小度小度”，它便会自称是小度智能语音助手。有网友推测谷歌可能在中文语料上用了百度的数据进行训练。经实测，截至发文该问题仍未得到解决。

6、谷歌发布新型视觉语言模型PixelLLM

12月15日，来自谷歌、加州大学圣地亚哥分校的团队发布论文，介绍了PixelLLM（像素对齐语言模型），该模型可以提供对图像上具体某个位置的详细描述，并精确指出其位置。该项目的目标是开发一种视觉语言模型，可以将位置（例如一组点或框）作为输入或输出。将位置作为输入时，模型会执行位置条件字幕，为指定对象或区域生成字幕；当生成位置作为输出时，模型会对语言模型生成的每个输出词进行像素坐标回归，从而执行密集词接地。该模型在本地化叙事数据集上进行了预训练，该数据集包含来自人类注意力的像素字对齐字幕。研究表明，PixelLLM可以应用于各种位置感知视觉语言任务，包括指代定位、位置条件字幕和密集物体字幕，并在RefCOCO和Visual Genome上取得了最先进的性能。

项目地址：https://jerryxu.net/PixelLLM

论文地址：https://arxiv.org/abs/2312.09237

7、百川智能发布Baichuan2-Turbo系列API

今日，百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API（应用程序接口），包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超长上下文窗口的基础上，还增加了搜索增强知识库的能力。即日起，API用户可上传文本资料来创建自身专属知识库，从而根据自身业务需求打造更完整、高效的智能解决方案。此外，百川智能还升级了官网模型体验，目前其官网大模型已支持PDF、Word等多种文本上传以及URL网址输入，用户可通过官网入口体验搜索增强和长窗口加持后的通用智能。

商业体验官网：https://platform.baichuan-ai.com/docs/api

8、芯原与谷歌携手合作开源项目Open Se Cura

据芯片定制服务提供商芯原微信公众号发文，今日，芯原宣布与谷歌合作支持新推出的开源项目Open Se Cura。该项目是一个由设计工具和IP库组成的开源框架，旨在加速安全、可扩展、透明和高效的AI系统的发展。作为该项目基础设施的一部分，芯原提供了多个IP、低功耗芯片设计、板级支持包（BSP），并负责推动该项目的商业化。（来源）

9、百奥几何与智谱AI将共建生物领域多模态大模型

据AI生物制药公司百奥几何微信公众号昨日发文，百奥几何与智谱AI近日宣布达成战略合作，共同致力于建设自然语言-生命语言多模态大模型。该模型预期将增进生成式AI平台在生命科学与医药研究领域的实用性，降低使用者的技术门槛，从而高效处理生物医药信息，并启发使用者发现新靶点、新分子、新问题，为AI大分子药物发现提供新的思路和工具，推动生物技术和制药技术的发展。基于该模型，使用者可以用人类的自然语言进行多次循序发问，获得在文献搜索、分子发现等研究过程中的智能辅助，从而解决复杂问题，搭建生命科学领域的垂直大模型。（来源）

10、微软 Visual Studio 迎来 AI 建议命名功能，需使用付费 GitHub Copilot Chat

微软于官网宣布在最新的Visual Studio预览版中，向GitHub Copilot Chat订阅用户推出AI驱动的变量、方法和类命名建议新功能。据介绍，该功能不仅能提供名称建议，还能了解标识符的使用方式和代码风格，从而提出与代码库无缝匹配的标识符，帮助用户提高代码的可读性和可维护性，确保代码在未来数年内的使用寿命和易懂性。（来源）

11、OpenAI新论文：用小模型监督大模型

今日凌晨，OpenAI发布了超级对齐（Superalignment）团队的第一篇论文，展示了从弱到强的泛化，通过小模型监督大模型。研究表明，可以使用GPT-2级别的模型来激发GPT-4的大部分能力，达到接近GPT-3.5级别的性能。这使得研究人员可以在取得迭代式经验进展的同时，调整未来的超人模型。OpenAI同步开源了代码，并且启动了一项1000万美元的资助计划，支持研究人员广泛开展超人类AI对齐工作。

论文地址：cdn.openai.com/papers/weak-to-strong-generalization.pdf

开源代码：github.com/openai/weak-to-strong

12、DeepMind研究登Nature 用LLM解决数学开放问题

谷歌DeepMind最新研究FunSearch登国际顶刊《自然》（Nature），这是一种搜索数学和计算机科学新解决方案的方法。FunSearch的工作原理是将预先训练好的大模型（LLM）与自动“评估器”配对使用，前者的目标是以计算机代码的形式提供创造性的解决方案，后者则负责防止出现幻觉和不正确的想法。通过这两个组件之间的来回迭代，初始解决方案“进化”为新知识。FunSearch发现了上限集问题的新解决方案，这是数学领域的一个长期未决问题，代表了利用大模型首次发现科学或数学领域具有挑战性的开放问题。

论文地址：nature.com/articles/s41586-023-06924-6

13、丹麦 AI 模型预测死亡率准确度超保险公司，引发被滥用担忧

丹麦科技大学的苏尼・莱曼・乔根森及其团队开发了一款强大的人工智能模型，可以根据个人数据预测死亡率，准确度远超现有的任何模型，甚至包括保险业使用的模型。研究人员表示，该模型能提前预警健康和社会问题，也需要警惕其被大型企业滥用。乔根森团队利用了涵盖丹麦 600 万人（2008-2020 年）教育、就医、诊断、收入和职业等丰富数据集，将其转化为可用于训练大型语言模型的文本。这种模型类似于 ChatGPT，ChatGPT 通过分析大量文本数据，预测下一个最可能的词，以此推断未来事件发生的可能性。同理，研究人员开发的“Life2vec”模型可以分析个人生命历程中的事件序列，预测接下来最有可能发生的事情。（来源：IT之家）

14、OpenAI 成立“防备”预警团队：董事会有权阻止新 AI 模型发布

开发了 ChatGPT 的 OpenAI 公司日前宣布成立新的“防备（Preparedness）”团队，旨在监控旗下技术可能带来的潜在威胁，防止其落入坏人之手，甚至被用于制造化学和生物武器。该团队由麻省理工学院人工智能教授亚历山大・马德里 (Aleksander Madry) 领导，将招募人工智能研究人员、计算机科学家、国家安全专家和政策专家等，对 OpenAI 开发的技术进行持续监测和测试，一旦发现任何危险苗头，及时向公司发出警告。（来源：IT之家）

15、微软宣布明年为 DirectX 机器学习框架 DirectML 添加 NPU 支持，适配英特尔酷睿 Ultra 等 AI 芯片

微软日前宣布，将在明年初为 DirectML 机器学习框架添加 NPU 支持，从而适配英特尔酷睿 Ultra 等内置 NPU 的芯片。微软在 2021 年推出了隶属 DirectX 家族的 DirectML 框架，该框架专注于“机器学习”，能够直接访问 GPU 进行深度学习，可为“图片降噪”、“游戏预渲染”、“光线追踪”等一系列 AI 参与计算的场景提供帮助。微软表示，在 DirectML 支持 NPU 后，开发者可以通过跨平台推理引擎“ONNX Runtime”等 API，使用芯片内置的 NPU 运行 AI 模型，从而改善模型运行效能。（来源：IT之家）

16、微软安卓版 Edge Copilot 视频摘要功能优化，新增快速模式

微软正在提升安卓版 Edge 浏览器生成视频摘要的能力，该公司在 Edge 的 Canary 版本中添加了一个名为“视频摘要快速模式”的新功能，该功能可以让用户快速创建详细的视频摘要，用户可以通过这个功能来了解 YouTube 和其他支持的视频平台上视频的重要部分。最近，安卓版 Edge 浏览器的 Canary 版本也加入了视频摘要的功能，该功能可以让用户通过 Copilot 快速获取视频信息。然而用户反映，Edge 生成的摘要太过模糊，几乎无法给出视频的重要信息。微软现在正在解决这个问题，并通过“视频摘要快速模式”提升安卓版 Edge 浏览器的视频摘要响应速度。（来源：IT之家）

AI PC装机指南