【2024年1月26日AI晚报】OpenAI推行新模型并大降价;通义千问视觉理解模型Qwen-VL升级

411次阅读
没有评论

共计 3222 个字符,预计需要花费 9 分钟才能阅读完成。

AI·快讯

1、OpenAI 大降价!修复 GPT-4 Turbo“变懒”问题

今日凌晨,OpenAI 宣布推出两款全新文本嵌入模型,包括更小、更高效的 text-embedding-3-small 和更大、性能更强的 text-embeddings-3-large。OpenAI 还更新了 GPT-4 Turbo 预览模型,修复此前模型“变懒”情况,同时发布迄今最稳健的文本审核模型,并将于下周推出全新 GPT-3.5 Turbo 模型,将输入价格降低了 50%,将输出价格降低 25%。此外,OpenAI 将推出两项平台改进,让开发人员更清楚地了解自己的使用情况,并对 API 密钥进行控制。( 来源

【2024 年 1 月 26 日 AI 晚报】OpenAI 推行新模型并大降价;通义千问视觉理解模型 Qwen-VL 升级

2、通义千问视觉理解模型 Qwen-VL 升级

阿里云公布多模态大模型研究进展,通义千问视觉理解模型 Qwen-VL 再次升级,继 Plus 版本之后推出 Max 版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,比肩 OpenAI 的 GPT-4V 和谷歌的 Gemini Ultra。相比 Qwen-VL,Qwen-VL-Plus 和 Qwen-VL-Max 拥有更强的视觉推理和中文理解能力,整体性能堪比 GPT-4V 和 Gemini Ultra。在 MMMU、MathVista 等测评中远超业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越 GPT-4V,达到世界最佳水平。目前 Qwen-VL-Plus 和 Qwen-VL-Max 限时免费,用户可以在通义千问官网、通义千问 APP 直接体验 Max 版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型 API。

【2024 年 1 月 26 日 AI 晚报】OpenAI 推行新模型并大降价;通义千问视觉理解模型 Qwen-VL 升级

3、谷歌云与 Hugging Face 建立战略合作伙伴关系

1 月 25 日,谷歌云与 Hugging Face 宣布双方建立战略合作伙伴关系。双方将在开放科学、开源、云和硬件方面进行合作,以便公司能够利用 Hugging Face 最新开放模型和谷歌云最新的云和硬件功能构建自己的 AI。

4、2023 年度吴文俊 AI 科学技术奖拟授奖项目公示

2023 年度吴文俊 AI 科学技术奖发布拟授奖项目信息并开启公示,公示期为 1 月 25 日至 2 月 3 日。任何单位和个人对拟授奖成果有异议者,可以书面形式实名向吴文俊科学技术奖励工作办公室提出,同时需提供准确的相关材料,对于匿名以及超出公示期后提出异议者恕不予受理。据悉,“吴文俊 AI 科学技术奖”由中国 AI 学会发起主办,是我国智能科学技术领域唯一以人民科学家、AI 开拓先驱、我国智能科学研究的开拓者和领军人、首届国家最高科学技术奖获得者、中国科学院院士、中国 AI 学会名誉理事长吴文俊先生命名,依托社会力量设立的科学技术奖,具备提名推荐国家科学技术奖资格,旨在奖励在智能科学研究中取得重要发现,着力实现原始创新与突破,或在 AI 领域攻克关键核心技术。

公示名单:http://www.wuwenjunkejijiang.cn/a/2235.html

5、工信部等:建设适用于生成式 AI 的行业数据集

工业和信息化部等九部门发布关于印发《原材料工业数字化转型工作方案(2024—2026 年)》的通知。方案提出,建设适用于生成式 AI 的行业数据集,基于现有通用大模型技术底座进行定制化开发训练,构建细分行业大模型,面向新材料研发、供应链优化、大宗商品价格预测等应用需求,加快大模型技术深度创新。强化 AI 驱动,探索建立原材料企业与 AI 企业之间的需求匹配和创新协同机制,加快推进 AI 技术赋能原材料工业。建设 1 个新材料大数据中心、4 个重点行业数字化转型推进中心、4 个重点行业制造业创新中心、5 个以上工业互联网标识解析二级节点、6 个以上行业级工业互联网平台。( 来源

6、上海 AI 实验室等推出文生 3D 模型 3DTopia

来自南洋理工大学、上海 AI 实验室等机构的研究人员,共同推出了文生 3D 基础模型 3DTopia。据演示视频显示,该模型中文名叫“书生·物华”,可 5 分钟快速生成多样化的高精度网格与纹理。3DTopia 的推理分为两个阶段进行,第一阶段根据提示词生成点云格式的粗糙模型,第二阶段基于该团队推出的 Threefiner 方法进行细化,完成上色等操作。

GitHub 主页:https://github.com/3DTopia/3DTopia

7、澜舟科技孟子大模型开放公众服务

澜舟科技孟子 GPT 大模型近日正式通过网信办生成式 AI 备案,正式面向公众开放服务。孟子 GPT 大模型是澜舟科技研发的生成式可控大语言模型,能够通过多轮对话,帮助用户在特定场景中完成各种工作任务。澜舟科技本次对外开放将上线四款大模型产品,包括:孟子大模型 - 轻量、孟子大模型 - 标准、孟子大模型 - 金融、孟子大模型 - 编程。

体验地址:https://www.langboat.com/product/mchat

8、谷歌发布生成式 AI 驱动的艺术自拍功能升级

谷歌旗下应用艺术与文化(Arts & Culture)宣布推出艺术自拍(Art Selfie)功能的 2.0 版本,利用生成式 AI 技术将用户的自拍无缝融入到艺术品风格中,目前支持超过 25 种风格。此外,谷歌宣布其艺术重绘(Art Remix)功能在更多国家 / 地区推出。( 来源

【2024 年 1 月 26 日 AI 晚报】OpenAI 推行新模型并大降价;通义千问视觉理解模型 Qwen-VL 升级

9、剪映小规模测试 AI 克隆音色功能

据科技自媒体数字生命卡兹克昨日报道,字节跳动旗下剪辑软件剪映近日开启克隆音色功能的小规模测试,大约 10% 的用户获得了体验资格,月底可能会全量上线。该功能只支持即时朗读随机文本录音输入,不支持上传音频用于克隆音色,大约需要 5 -10 秒的录制即可生成。( 来源

【2024 年 1 月 26 日 AI 晚报】OpenAI 推行新模型并大降价;通义千问视觉理解模型 Qwen-VL 升级

10、夸克上线大模型新产品“AI PPT”,可一键生成提纲、创作 PPT

依托自研大模型,夸克 App 推出全新产品“AI PPT”。用户仅需输入 PPT 主题,就能在几十秒内生成一份精美专业的 PPT 文档。“AI PPT”可根据用户输入的主题或按照内容分类生成 PPT 模板,并可根据用户提供的主题生成平均页数在 25 页以上的智能大纲,还能够在每页中在线调整结构、文字、图片。夸克“AI PPT”依托千亿参数的自研大模型和数据精调,把制作 PPT 的过程进行了结构化处理,提供了更加智能的使用体验。与市场上同类产品相比,夸克文档推出的“AI PPT”具有更智能、更专业、更易操作三大特点,让用户在手机端就能完成 PPT 创作,并联合 iSlide 等行业头部平台,提供海量和专业的各类模板。( 来源

【2024 年 1 月 26 日 AI 晚报】OpenAI 推行新模型并大降价;通义千问视觉理解模型 Qwen-VL 升级

11、国内首个非 Attention 大模型发布

岩山科技旗下创企岩芯数智(Rock AI)推出国内首个非 Attention 机制的大模型 Yan,也是业内少有的非 Transformer 架构大模型。据岩芯数智 CEO 刘凡平介绍,Yan 是一个通用大语言模型,拥有相较于同等参数 Transformer 的 7 倍训练效率、5 倍推理吞吐、3 倍记忆能力,同时支持 CPU 无损运行、低幻觉表达、100% 支持私有化应用。

12、腾讯文档智能助手开启公测

腾讯文档智能助手正式开启公测,全面应用于 Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。腾讯文档 AI 能力的升级涵盖了文本内容秒级处理、函数公式运算应用、表格数据精准呈现、PPT 快速生成美化、收集结果自动分析、思维导图一键生成等多项能力,并支持跨品类文档内容畅通流转。即日起,智能助手将面向全体用户陆续开放体验。

13、OpenAI 为 ChatGPT 推出多语言功能 Alpha 版,可将界面改为简体中文

OpenAI 近日为 ChatGPT 更新了“多语言功能”Alpha 版,用户可以在 ChatGPT 主界面中点击自己的头像,进入“设置”-“通用”、“语言环境(Alpha)”,即可将界面修改为简体中文。将界面修改为简体中文后, 用户在 ChatGPT 聊天处的提示句按钮也变为简体中文,但用户直接按下快捷按钮后自动输入的还是英文内容 ,有待 OpenAI 进行改进。

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2024-01-26发表,共计3222字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。