共计 2298 个字符,预计需要花费 6 分钟才能阅读完成。
AI·快讯
1、微软发布 27 亿参数基座模型 Phi-2
昨日晚间,微软发布 27 亿参数的语言模型 Phi-2,据称可与规模大 25 倍的大模型相媲美,该模型目前已加入 Azure AI Studio。Phi- 2 基于 Transformer 训练,目标是预测下一个单词,它在 1.4T 个词组上进行了训练,这些词组来自 NLP 和编码的合成数据集或网络数据集,训练在 96 个英伟达 A100 GPU 上耗时 14 天。Phi- 2 是一个基座(Base)模型,没有通过人类反馈强化学习(RLHF)进行调整,也没有经过指导性微调。在多个基准测评上,只有 2.7B 的 Phi- 2 性能超越了 Mistral 和 Llama 2 的 7B 或 13B 模型,以及谷歌 3.2B 规模的 Gemini Nano 2。(来源:IT 之家)
官方介绍:https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models
2、Meta 开启 雷朋 智能眼镜多模态 AI 功能测试,可识别物体、翻译语言
Meta 公司今日宣布,将开始向部分用户推送其 Meta Ray-Ban 智能眼镜的多模态 AI 功能。这项功能可以让 AI 助手通过眼镜的摄像头和麦克风,了解佩戴者所看到和听到的东西,并提供相关信息和帮助。Meta CEO 马克・扎克伯格在 Instagram 上展示了这项功能,他让眼镜推荐能与他拿着的一件衬衫相配的裤子。眼镜不仅准确描述了衬衫,还提供了几款搭配建议。除此之外,扎克伯格还展示了眼镜 AI 助手翻译文本和生成图片描述的能力。
3、便携式 AI 系统可将思想翻译成语言
据物理学家组织网 11 日报道,澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤(包括中风或瘫痪)而无法说话的人进行沟通,也有望实现人与仿生手臂或机器人等设备之间的无缝通信。最新研究代表了将原始脑电图(EEG)直接翻译成语言的开创性努力,标志着该领域的一次重大突破。(来源:科技日报)
4、OpenAI 非盈利母公司财务数据发布
据外媒 The Verge 报道,美国国税局(IRS)近日发布了 OpenAI 的非盈利母公司 2022 年的财务数据,但其中不包括 OpenAI 实体公司的数据。文件显示,CEO 萨姆·阿尔特曼(Sam ALtman)在 2022 年获得了 7.35 万美元的报酬,联合创始人格雷格·布罗克曼(Greg Brockman)和伊利亚·苏特斯科夫(Ilya Sutskever)的薪酬分别为 11.4 万美元和 33.5 万美元,前董事会的其他三名成员分文未得。
文件地址:s3.documentcloud.org/documents/24215980/openai-form-990-irs-2022.pdf
5、北京互联网法院公开审理全国首例“AI 声音侵权案”
据北京互联网法院官方公众号消息,12 月 12 日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI 声音侵权案”,目前该案仍在进一步审理中。在该案中,原告殷某某以配音为职业,曾录制多部有声作品。殷某某意外发现,自己的声音被 AI 化后,在一款名为“魔音工坊”的 App 上以“魔小璇”的名义对外出售。因此,殷某某以被告行为侵害其声音权为由,将“魔音工坊”的运营主体北京小问智能科技有限公司等五被告起诉到北京互联网法院。(来源:IT 之家)
6、华为交通大模型研发启动
据华为云官方消息,12 月 12 日,华为技术有限公司联合云南省交通投资建设集团有限公司以及长安大学在昆明举行“交通大模型研发启动仪式”,正式开启人工智能大模型技术在交通领域的研究探索。据介绍,为加速推动交通行业智能化发展水平,抢占行业发展先机,加速交通企业数字化转型,基于华为云盘古大模型,华为携手云南交投集团、长安大学,通过技术赋能、人才发展、高校协同、生态聚合等多重举措,积极开展交通大模型研究和探索工作。(来源:IT 之家)
7、安卓 Canary 版微软 Edge Copilot 已支持视频摘要功能
微软 Edge 浏览器近日在 Android Canary 版本中更新了 Copilot 功能,使其可以为带有字幕的 Youtube 视频生成摘要。该功能此前已在桌面版 Edge Canary 频道上线,现在登陆了安卓平台。如何使用 Copilot 在 Edge Canary 浏览器上生成视频摘要:
确保你使用的是最新版 Edge Canary 浏览器(版本号为 121.0.2271.0)。
访问 edge://flags,找到并启用“Video Copilot”选项。
重启 Edge 浏览器。
打开带有字幕的 YouTube 视频。
点击底部 Copilot 图标,并点击总结视频内容按键。
Copilot 将生成简短的视频摘要,并列出视频中重要时刻的时间戳,供快速跳转。
8、美图推出移动端 AI 生图工具 WHEE,基于 MiracleVision 大模型
据美图秀秀消息,移动端 AI 生图工具 WHEE 现已上线,基于美图 MiracleVision 大模型,提供一站式 AI 视觉创作服务。官方表示,WHEE 是一款在线生成的 AI 视觉创作工具,面向大众用户及专业视觉创作者,以“工作流”作为核心功能串联,提供文生图、图生图、画面拓展及局部修改等 AIGC 图像服务。美图公司日前刚刚推出了 AI 模型 MiracleVision 4.0 版本,相比上一代新增了“AI 设计”与“AI 视频”能力,新版本将于 2024 年 1 月陆续应用于美图秀秀、美颜相机、Wink、美图设计室、WHEE 等美图旗下产品。