【2023年12月6日AI晚报】谷歌全新大语言模型 Gemini 1.0 正式亮相;OpenAI 首席执行官 Sam Altman 被《时代》周刊评为年度 CEO

124次阅读
没有评论

共计 2120 个字符,预计需要花费 6 分钟才能阅读完成。

AI·快讯

1、谷歌高调炸场:全新大语言模型 Gemini 1.0 正式亮相,近乎全面领先于 OpenAI GPT-4

在 6 月份的 I / O 开发者大会上,谷歌 CEO 皮查伊首次透露 Gemini 的存在,现在正式面向公众推出。谷歌表示,这是其迄今为止功能最强大、最通用的大语言模型。根据谷歌给出的基准测试结果,Gemini 在许多测试中都表现出了“最先进的性能”,甚至在大部分基准测试中完全击败了 OpenAI 的 GPT-4。谷歌针对不同场景发布了三种不同版本:Gemini Ultra、Gemini Pro 和 Gemini Nano。(来源:IT 之家

这些不同的版本也将适用于不同的场景和案例:

  • Gemini Ultra – 用于处理高度复杂任务的最强、最大的模型。

  • Gemini Pro – 用于扩展各种任务的最佳模型。

  • Gemini Nano – 用于手机等设备的最高效模型。

【2023 年 12 月 6 日 AI 晚报】谷歌全新大语言模型 Gemini 1.0 正式亮相;OpenAI 首席执行官 Sam Altman 被《时代》周刊评为年度 CEO

2、美图与站酷联合发起“AI 新锐设计师”计划

由美图与站酷联合举办的 2023 站酷 CUBE 设计大会在厦门举行。美图公司创始人、董事长兼 CEO 吴欣鸿在前一天宣布了美图与站酷的深度战略合作。吴欣鸿表示,AI 正引领设计行业进入新的境界,美图与站酷联合发起“AI 新锐设计师”计划,将为设计师群体提供 AI 设计工具、学习平台、商业机会。未来,站酷创作者可加入美图视觉大模型 MiracleVision 的模型生态,训练自己的风格模型。

3、阿尔特曼称 OpenAI 正重新考虑公司结构,找到盈利和非盈利的平衡点

12 月 6 日消息,OpenAI 创始人兼 CEO 萨姆・阿尔特曼(Sam Altman)今日在越南一场 AI 活动上表示,OpenAI 正在重新考虑其盈利和非盈利的混合结构。他表示,(公司结构)目前“显然存在一些缺陷”,新董事会正认真考虑符合宗旨的最佳结构。他对于之前传闻中的超级智能 Q*(发音为 Q-Star)拒绝置评。(来源:IT 之家

4、OpenAI 首席执行官 Sam Altman 被《时代》周刊评为年度 CEO

12 月 6 日消息,当地时间周三,OpenAI 首席执行官萨姆・阿尔特曼(Sam Altman)被《时代》周刊评为年度 CEO。除了阿尔特曼之外,泰勒・斯威夫特被评为“年度人物”;莱昂内尔・梅西被评为“年度最佳运动员”。(来源:IT 之家

【2023 年 12 月 6 日 AI 晚报】谷歌全新大语言模型 Gemini 1.0 正式亮相;OpenAI 首席执行官 Sam Altman 被《时代》周刊评为年度 CEO

5、苹果开源用于芯片设计的机器学习框架 MLX

今天,苹果机器学习研究团队的 Awni Hannun 于社交平台 X 发布了 MLX,这是一个专为 Apple Silicon 芯片设计的高效机器学习框架,目前已开源。据 GitHub 主页显示,MLX 包括 Python API、C++ API,具有用于自动微分、自动矢量化和计算图优化的可组合函数转换,采用惰性计算,动态构建计算图,支持多设备,并且统一内存。苹果还开源了 MLX Data,这是一个与框架无关的、高效且灵活的数据加载包。

MLX 开源地址:https://github.com/ml-explore/mlx

MLX Data 开源地址:https://github.com/ml-explore/mlx-data

6、Transformer 挑战者出现 吞吐量高 5 倍

为了解决 Transformer 在长序列上的计算效率低下问题,卡内基梅隆大学(CMU)和普林斯顿大学的研究者于 12 月 1 日提出了一种新架构 Mamba(曼巴)。Mamba 是一种状态空间模型(SSM),具有快速推理和序列长度的线性缩放优势,据称吞吐量比 Transformer 高 5 倍,并且在真实数据上处理长达百万长度的序列时性能有所提升。作为一个通用的序列模型主要干,Mamba 在语言、音频和基因组学等多种领域都实现了最先进的性能。在语言建模方面,Mamba-3B 模型在预训练和下游评估方面都优于同等大小的 Transformer,其性能甚至可与两倍大小的 Transformer 相媲美。

论文地址:https://arxiv.org/abs/2312.00752

7、最高 1.8 万个字符,微软邀请部分 Copilot 用户测试 Notebook 界面

广告和网络服务首席执行官米哈伊尔・帕拉欣(Mikhail Parakhin)今天发布推文,表示将邀请部分 Copilot 用户,在和必应聊天以及使用必应搜索时测试全新的 Notebook 界面。用户点击之后,左侧可以输入文本提示,右侧会显示相关结果。帕拉欣表示该视图下,Copilot 用户可以更容易复制和处理提示词,而且可以记录历史。(来源:IT 之家

8、微软 Edge Copilot 已支持总结视频内容,并生成时间戳

12 月 6 日消息,在数字信息时代,视频已成为人们获取信息的重要途径。然而,视频内容的复杂性往往使人难以快速找到所需信息。微软公司近日宣布,其 Edge 浏览器的 Copilot 功能将迎来一项重大更新:视频信息处理能力。据微软广告与网络服务部门 CEO 米哈伊尔・帕拉欣(Mikhail Parakhin)透露,更新后的 Copilot 能够在播放 YouTube 视频的同时显示视频摘要。更令人印象深刻的是,即使上传的 YouTube 视频本身不包含时间戳,Copilot 也能通过分析视频内容,自动生成关键部分的时间戳和摘要,为观众提供详细的内容概览,无需手动快进视频。

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-12-07发表,共计2120字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。