【2024年1月28日AI晚报】Meta发布开源代码大模型Code Llama 70B;科大讯飞发布星火认知大模型V3.5

1,044次阅读
没有评论

共计 2935 个字符,预计需要花费 8 分钟才能阅读完成。

AI·快讯

1、百川智能发布超千亿参数大模型 Baichuan 3,号称中文评测超越 GPT-4

今天,百川智能正式发布超千亿参数大语言模型 Baichuan 3。Baichuan 3 基础能力全面提升,在多项权威评测 CMMLU、GAOKAO 和 AGI-Eval 中,Baichuan 3 中文任务成绩超越 GPT-4。对逻辑推理能力及专业性要求较高的 MCMLE、MedExam、CMExam 等权威医疗评测上,Baichuan 3 中文效果同样超过 GPT-4。在测试逻辑推理能力的 MCMLE、MedExam、CMExam 等医疗评测上,Baichuan 3 的中文效果同样号称超过了 GPT-4,是“中文医疗任务表现最佳的大模型 ”。( 来源

地址:https://www.baichuan-ai.com/chat

【2024 年 1 月 28 日 AI 晚报】Meta 发布开源代码大模型 Code Llama 70B;科大讯飞发布星火认知大模型 V3.5

2、书生·浦语灵笔 2.0 正式开源

海 AI 实验室微信公众号昨天宣布推出全面升级的图文混合创作大模型书生·浦语灵笔 2.0(InternLM-XComposer2),书生·浦语灵笔 2.0 是在书生·浦语 2.0 的基础上通过图文拓展训练获得的。基于 InternLM2 强大的语言建模能力,浦语灵笔 2.0 的图文理解和创作能力显著提升,可为用户提供图文创作体验,在 12 项图文能力评测中领先同量级开源模型。书生·浦语灵笔 2.0 开源了图文创作大模型(InternLM-XComposer2-7B)和它背后的图文理解与问答模型(InternLM-XComposer2-VL-7B),均提供免费商用。

GitHub 地址: https://github.com/InternLM/InternLM-XComposer

技术报告:https://github.com/InternLM/InternLM-XComposer/blob/InternLM-XComposer2/InternLM-XComposer2-Report.pdf

【2024 年 1 月 28 日 AI 晚报】Meta 发布开源代码大模型 Code Llama 70B;科大讯飞发布星火认知大模型 V3.5

3、苹果 iOS 18 将搭载生成式 AI

彭博社记者马克·古尔曼 1 月 28 日报道,苹果 iOS 18 将采用生成式 AI 技术,以提升 Siri 和 Messages 应用程序在问答和自动补全句子方面的能力。(来源

4、Arc 浏览器推出了移动版 Arc Search

近期引发热议的新浏览器 Arc,推出了移动版 Arc Search。官方认为,在移动端,浏览器的主要用途是搜索。目前已在国内 App store 上架,大家可以下载尝试。这款浏览器致力于提升搜索效率,内置了智能浏览功能,能自动总结前六个搜索结果,助你快速做出选择。此外,Arc 还将推出一项新标签同步服务,实现 Windows、iOS 和 Mac 浏览器标签的同步,让浏览更加无缝便捷!

地址:https://apps.apple.com/cn/app/arc-search/id6472513080

【2024 年 1 月 28 日 AI 晚报】Meta 发布开源代码大模型 Code Llama 70B;科大讯飞发布星火认知大模型 V3.5

5、AI 浏览器助手 Brave Leo 宣布将 Mixtral 8x7B 作为默认选项

AI 浏览器助手 Brave Leo 在近期更新中,宣布将 Mixtral 8x7B 集成为 Leo 中默认的大语言模型(LLM),Leo 是我们最近发布的,保护隐私的 AI 浏览器助手。Mixtral 8x7B 是由 Mistral AI 去年 12 月发布的开源 LLM,并且由于其速度和性能,已经被广泛使用。此外,我们对 Leo 用户体验进行了一些改进,重点关注更清晰的入门引导、上下文控制、输入和响应格式化以及一般的 UI 优化。(来源

【2024 年 1 月 28 日 AI 晚报】Meta 发布开源代码大模型 Code Llama 70B;科大讯飞发布星火认知大模型 V3.5

6、APUS 联合波形智能推出中文创作大模型

1 月 29 日,APUS 联合战略合作伙伴波形智能发布了新一代中文创作大模型,主打六大核心能力:更深更广的创作垂域、更自然真实的创作文风、更强的长文本生成能力、更快的生成速度、原生支持函数调用(function calling)、原生支持个性化知识库,据称在小说写作、营销文案写作、短视频脚本写作、论文写作等 Benchmark 上击败了 GPT 等通用大型语言模型。该模型进一步赋能 APUS 自身产品——萤火小说,据称显著提升内容召回的利用率达 50%,并运用 RAG+ 仿写技术让 AI“越写越懂你”。

7、智源发布通用向量模型 BGE-M3

智源发布了 BGE 家族新成员——通用语义向量模型 BGE-M3,支持超过 100 种语言,具备领先的多语言、跨语言检索能力,支撑“句子”、“段落”、“篇章”、“文档”等不同粒度的输入文本,最大输入长度为 8192,并且一站式集成了稠密检索、稀疏检索、多向量检索三种检索功能,在多个评测基准中达到最优水平。BGE-M3 是首个集多语言(Multi-Linguality)、多粒度(Multi-Granularity)、多功能(Multi-Functionality)三大技术特征于一体的语义向量模型,目前已向社区全面开源并支持免费商用许可。

GitHub 地址:https://github.com/FlagOpen/FlagEmbedding

模型链接:https://huggingface.co/BAAI/bge-m3

8、科大讯飞发布星火认知大模型 V3.5

今天,科大讯飞发布星火认知大模型 V3.5,讯飞星火 V3.5 七大能力全面提升,其中语言理解、数学能力超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解能力达到 GPT-4V 的 91%。讯飞星火 V3.5 也是首个基于全国产算力训练的大模型。去年 10 月 24 日,讯飞首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启用。此外,科大讯飞还发布了星火语音大模型、130 亿参数规模的星火开源大模型。

【2024 年 1 月 28 日 AI 晚报】Meta 发布开源代码大模型 Code Llama 70B;科大讯飞发布星火认知大模型 V3.5

9、Meta 发布开源大模型 Code Llama 70B

Meta 今日发布了开源大模型 Code Llama 70B,这是其代码生成模型的新版本。Code Llama 70B 经过 5000 亿个代码标记和代码相关数据的训练,支持 100000 个 Tokens 的更长上下文,使其能够处理和生成更长、更复杂的代码。Code Llama 70B 在 HumanEval 上得分为 67.8,与闭源模型 GPT-4(68.2)和 Gemini Pro(69.4)相当,远超此前的开源代码模型 CodeGen-16B-Mono(29.3)和 StarCoder(40.1)等。

GitHub 地址:https://github.com/facebookresearch/llama

Hugging Face 地址:https://huggingface.co/codellama

【2024 年 1 月 28 日 AI 晚报】Meta 发布开源代码大模型 Code Llama 70B;科大讯飞发布星火认知大模型 V3.5

10、代码编辑器 Zed 宣布开源:使用 Rust 编写,号称启动速度比微软 VS Code 快 4 倍

Zed 是一款新兴的代码编辑器,主打使用 Rust 构建,日前官方在博客中宣布这款编辑器正式开源。据悉,该编辑器本体代码采用 GPL 授权形式,服务器端组件使用 AGPL 授权,GPUI 用户界面框架则以 Apache 2 授权发布。Zed 编辑器最大的优势是“高性能”,号称能够充分利用设备的 CPU、GPU 能力,让应用程序启动、文件加载、键盘响应速度“更快”,官方声称,与微软 Visual Studio Code 相比,Zed 的启动速度快了 4 倍,而 RAM 占用少了一半

GitHub 地址:https://github.com/zed-industries/zed

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2024-01-30发表,共计2935字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。