【2023年12月19日AI晚报】百川智能发布 Baichuan2-Turbo 系列 API;OpenAI 新论文,用小模型监督大模型

330次阅读
没有评论

共计 4659 个字符,预计需要花费 12 分钟才能阅读完成。

AI·快讯

1、众安保险内测 AI 写代码,6个月开发提效超 20%

众安保险已启动 AI 辅助写代码,6个月内开发提效超 20%。众安内部基于 AI 研发的代码助手 DevPilot 已实现支持代码生成、单测生成、生成注释、代码修复、Code Review、性能检查、代码解释等能力。目前,DevPilot 已面向全行业开源。作为一家 50% 员工都是技术人员的公司,众安保险的数字化程度是中国保险公司中最高的一家。过去一年,AI 技术已应用到众安的企业微信内容创作、智能营销、客服服务质量检测、智能费控、法律合规、内部员工培训、图像识别技术等领域。

2、Iterate.ai 开源能识别武器的 AI 系统

Iterate.ai 开源了能识别武器的 AI 系统 Weapon Detection Web Application (WEPWEB),源代码采用 MIT 许可证托管在 GitHub 上。Iterate.ai 的团队使用了逾 2 万个闯入和武装抢劫视频进行训练,并雇佣了 DEA(美国缉毒署)的一名前特工帮助测试,软件运行在英伟达显卡上,能即时检测出数十种枪支类型、防弹背心、巴拉克拉瓦盔式帽和刀具。开源是为了帮助学校和非盈利组织提高安全性,在发生武装入侵的情况下挽救生命。

GitHub 地址:https://github.com/IterateAI/OpenThreatDetection/tree/dev

3、腾讯云推出高性能应用服务 HAI

据腾讯云微信公众号发文,今日,腾讯云推出高性能应用服务 HAI(Hyper Application Inventor),助力 GPU 算力实现开箱即用、一键部署,10 分钟开发专属 AI 应用。据介绍,用户只需点击选择模型、地域、算力类型、硬盘大小,即可一键创建环境。HAI 预装了 Stable Diffusion、ChatGLM 等多种热门模型,几分钟就能构建出专属大语言模型、AI 作画等应用环境,用户也可以基于 HAI 部署自己的开源模型。HAI 提供可视化交互界面,支持 JupyterLab、WebUI 等多种算力连接方式,还支持“学术加速”,线路自动择优,大幅提升主流学术资源平台的访问和下载速度。

HAI 试用地址:http://cloud.tencent.com/product/hai

4、GPT-4.5 疑似灰度测试 OpenAI 称系幻觉

近日有网友发现 GPT-4.5 疑似正在进行灰度测试,当询问 ChatGPT 调用模型的具体名称时,它回答是 gpt-4.5-turbo。今日,OpenAI 应用研究员 Will DePue 对此回应,称这并不是 GPT-4.5 被泄露,只是一种非常奇怪的持续幻觉。此前,社交平台 X 博主 @apples_jimmy 曾爆料说 GPT-4.5 将在 12 月底发布。

【2023 年 12 月 19 日 AI 晚报】百川智能发布 Baichuan2-Turbo 系列 API;OpenAI 新论文,用小模型监督大模型

5、谷歌 Gemini 出现幻觉 自称文心大模型

近日有多名网友反馈,谷歌的 Gemini Pro 模型在进行中文对话时出现幻觉,当用户使用先问“你好”再问“你是谁”的固定句型时,会回复称自己是百度文心大模型。随后再对 Gemini Pro 进行追问,如“你的创始人是谁”,它会继续“扮演”文心大模型这个角色,回答说是李彦宏;或是称呼其为“小度小度”,它便会自称是小度智能语音助手。有网友推测谷歌可能在中文语料上用了百度的数据进行训练。经实测,截至发文该问题仍未得到解决。

【2023 年 12 月 19 日 AI 晚报】百川智能发布 Baichuan2-Turbo 系列 API;OpenAI 新论文,用小模型监督大模型

6、谷歌发布新型视觉语言模型 PixelLLM

12 月 15 日,来自谷歌、加州大学圣地亚哥分校的团队发布论文,介绍了 PixelLLM(像素对齐语言模型),该模型可以提供对图像上具体某个位置的详细描述,并精确指出其位置。该项目的目标是开发一种视觉语言模型,可以将位置(例如一组点或框)作为输入或输出。将位置作为输入时,模型会执行位置条件字幕,为指定对象或区域生成字幕;当生成位置作为输出时,模型会对语言模型生成的每个输出词进行像素坐标回归,从而执行密集词接地。该模型在本地化叙事数据集上进行了预训练,该数据集包含来自人类注意力的像素字对齐字幕。研究表明,PixelLLM 可以应用于各种位置感知视觉语言任务,包括指代定位、位置条件字幕和密集物体字幕,并在 RefCOCO 和 Visual Genome 上取得了最先进的性能。

项目地址:https://jerryxu.net/PixelLLM

论文地址:https://arxiv.org/abs/2312.09237

7、百川智能发布 Baichuan2-Turbo 系列 API

今日,百川智能宣布开放基于搜索增强的 Baichuan2-Turbo 系列 API(应用程序接口),包含 Baichuan2-Turbo-192K 及 Baichuan2-Turbo。在支持 192K 超长上下文窗口的基础上,还增加了搜索增强知识库的能力。即日起,API 用户可上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。此外,百川智能还升级了官网模型体验,目前其官网大模型已支持 PDF、Word 等多种文本上传以及 URL 网址输入,用户可通过官网入口体验搜索增强和长窗口加持后的通用智能。

商业体验官网:https://platform.baichuan-ai.com/docs/api

8、芯原与谷歌携手合作开源项目 Open Se Cura

据芯片定制服务提供商芯原微信公众号发文,今日,芯原宣布与谷歌合作支持新推出的开源项目 Open Se Cura。该项目是一个由设计工具和 IP 库组成的开源框架,旨在加速安全、可扩展、透明和高效的 AI 系统的发展。作为该项目基础设施的一部分,芯原提供了多个 IP、低功耗芯片设计、板级支持包(BSP),并负责推动该项目的商业化。( 来源

9、百奥几何与智谱 AI 将共建生物领域多模态大模型

据 AI 生物制药公司百奥几何微信公众号昨日发文,百奥几何与智谱 AI 近日宣布达成战略合作,共同致力于建设自然语言 - 生命语言多模态大模型。该模型预期将增进生成式 AI 平台在生命科学与医药研究领域的实用性,降低使用者的技术门槛,从而高效处理生物医药信息,并启发使用者发现新靶点、新分子、新问题,为 AI 大分子药物发现提供新的思路和工具,推动生物技术和制药技术的发展。基于该模型,使用者可以用人类的自然语言进行多次循序发问,获得在文献搜索、分子发现等研究过程中的智能辅助,从而解决复杂问题,搭建生命科学领域的垂直大模型。( 来源

【2023 年 12 月 19 日 AI 晚报】百川智能发布 Baichuan2-Turbo 系列 API;OpenAI 新论文,用小模型监督大模型

10、微软 Visual Studio 迎来 AI 建议命名功能,需使用付费 GitHub Copilot Chat

微软于官网宣布在最新的 Visual Studio 预览版中,向 GitHub Copilot Chat 订阅用户推出 AI 驱动的变量、方法和类命名建议新功能。据介绍,该功能不仅能提供名称建议,还能了解标识符的使用方式和代码风格,从而提出与代码库无缝匹配的标识符,帮助用户提高代码的可读性和可维护性,确保代码在未来数年内的使用寿命和易懂性。( 来源

【2023 年 12 月 19 日 AI 晚报】百川智能发布 Baichuan2-Turbo 系列 API;OpenAI 新论文,用小模型监督大模型

11、OpenAI 新论文:用小模型监督大模型

今日凌晨,OpenAI 发布了超级对齐(Superalignment)团队的第一篇论文,展示了从弱到强的泛化,通过小模型监督大模型。研究表明,可以使用 GPT- 2 级别的模型来激发 GPT- 4 的大部分能力,达到接近 GPT-3.5 级别的性能。这使得研究人员可以在取得迭代式经验进展的同时,调整未来的超人模型。OpenAI 同步开源了代码,并且启动了一项 1000 万美元的资助计划,支持研究人员广泛开展超人类 AI 对齐工作。

论文地址:cdn.openai.com/papers/weak-to-strong-generalization.pdf

开源代码:github.com/openai/weak-to-strong

12、DeepMind 研究登 Nature 用 LLM 解决数学开放问题

谷歌 DeepMind 最新研究 FunSearch 登国际顶刊《自然》(Nature),这是一种搜索数学和计算机科学新解决方案的方法。FunSearch 的工作原理是将预先训练好的大模型(LLM)与自动“评估器”配对使用,前者的目标是以计算机代码的形式提供创造性的解决方案,后者则负责防止出现幻觉和不正确的想法。通过这两个组件之间的来回迭代,初始解决方案“进化”为新知识。FunSearch 发现了上限集问题的新解决方案,这是数学领域的一个长期未决问题,代表了利用大模型首次发现科学或数学领域具有挑战性的开放问题。

论文地址:nature.com/articles/s41586-023-06924-6

13、丹麦 AI 模型预测死亡率准确度超保险公司,引发被滥用担忧

丹麦科技大学的苏尼・莱曼・乔根森及其团队开发了一款强大的人工智能模型,可以根据个人数据预测死亡率,准确度远超现有的任何模型,甚至包括保险业使用的模型。研究人员表示,该模型能提前预警健康和社会问题,也需要警惕其被大型企业滥用。乔根森团队利用了涵盖丹麦 600 万人(2008-2020 年)教育、就医、诊断、收入和职业等丰富数据集,将其转化为可用于训练大型语言模型的文本。这种模型类似于 ChatGPT,ChatGPT 通过分析大量文本数据,预测下一个最可能的词,以此推断未来事件发生的可能性。同理,研究人员开发的“Life2vec”模型可以分析个人生命历程中的事件序列,预测接下来最有可能发生的事情。(来源:IT 之家

14、OpenAI 成立“防备”预警团队:董事会有权阻止新 AI 模型发布

开发了 ChatGPT 的 OpenAI 公司日前宣布成立新的“防备(Preparedness)”团队,旨在监控旗下技术可能带来的潜在威胁,防止其落入坏人之手,甚至被用于制造化学和生物武器。该团队由麻省理工学院人工智能教授亚历山大・马德里 (Aleksander Madry) 领导,将招募人工智能研究人员、计算机科学家、国家安全专家和政策专家等,对 OpenAI 开发的技术进行持续监测和测试,一旦发现任何危险苗头,及时向公司发出警告。(来源:IT 之家

15、微软宣布明年为 DirectX 机器学习框架 DirectML 添加 NPU 支持,适配英特尔酷睿 Ultra 等 AI 芯片

微软日前宣布,将在明年初为 DirectML 机器学习框架添加 NPU 支持,从而适配英特尔酷睿 Ultra 等内置 NPU 的芯片。微软在 2021 年推出了隶属 DirectX 家族的 DirectML 框架,该框架专注于“机器学习”,能够直接访问 GPU 进行深度学习,可为“图片降噪”、“游戏预渲染”、“光线追踪”等一系列 AI 参与计算的场景提供帮助。微软表示,在 DirectML 支持 NPU 后,开发者可以通过跨平台推理引擎“ONNX Runtime”等 API,使用芯片内置的 NPU 运行 AI 模型,从而改善模型运行效能。(来源:IT 之家

16、微软安卓版 Edge Copilot 视频摘要功能优化,新增快速模式

微软正在提升安卓版 Edge 浏览器生成视频摘要的能力,该公司在 Edge 的 Canary 版本中添加了一个名为“视频摘要快速模式”的新功能,该功能可以让用户快速创建详细的视频摘要,用户可以通过这个功能来了解 YouTube 和其他支持的视频平台上视频的重要部分。最近,安卓版 Edge 浏览器的 Canary 版本也加入了视频摘要的功能,该功能可以让用户通过 Copilot 快速获取视频信息。然而用户反映,Edge 生成的摘要太过模糊,几乎无法给出视频的重要信息。微软现在正在解决这个问题,并通过“视频摘要快速模式”提升安卓版 Edge 浏览器的视频摘要响应速度。(来源:IT 之家

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-12-20发表,共计4659字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。