共计 3310 个字符,预计需要花费 9 分钟才能阅读完成。
AI·快讯
1、语音生成模型 SpeechX 发布,支持多种语言转换工作
据 Arxiv 页面显示,由来自微软和哈尔滨工业大学等机构的学者们近日发布了一款语音生成模型 SpeechX。据介绍,SpeechX 是一个多功能的语音生成模型,可以进行多种语音转换任务,并对噪声信号进行处理。SpeechX 结合了神经编码器语言建模和多任务学习,使用任务相关的提示进行统一且可扩展的建模,为语音增强和转换任务中利用文本输入提供了一致的方式。实验结果显示,SpeechX 在文本转语音、噪声抑制、目标说话人提取等各种任务中表现出较专门模型相当或更高的性能。
2、阿里达摩院发布癌症通用模型,可辅助诊断八种主流癌症
据 阿里达摩院 官方消息,阿里达摩院发布多癌影像分析通用模型,可检测、分割和诊断八种主要的高发致死癌症。该模型由达摩院医疗 AI 团队联合中山大学肿瘤防治中心、四川省肿瘤医院、浙大附属第一医院、盛京医院、广东省人民医院等单位共同研发。研究团队提出了一个统一的多癌影像分析通用模型,以 Mask Transformer 语义分割为基础,解决多种肿瘤图像此前难以统一检测、分割和诊断的问题,适用于八种主流的高发高致死癌症(肺、结直肠、肝、胃、乳腺、食管、胰腺、肾)以及相关器官中的肿瘤子类型。该模型的论文成果已被计算机视觉顶会 ICCV 2023 收录,目前已在上海市第一人民医院等多家合作医院进行应用测试。
3、Adobe 旗下 AI 图片编辑工具 Express 正式上线
Adobe 今天宣布,旗下 AI 图片设计、编辑工具 Express 结束测试,正式向所有用户开放。正式版 Express 带来了诸多新功能,可以利用 Adobe Firefly 提供支持的 AI 生成功能来生成不同的文字效果和图片,并对不同的内容进行修改。此外,正式版 Express 还可以合并视频、图片和音乐,轻松完成视频制作。桌面版 Adobe Express 现已正式上线,移动版应用将会在不久后更新。
4、OpenAI 收购 Global Illumination,致力于开发核心产品
据 OpenAI 官方消息,OpenAI 已经收购 Global Illumination,不过收购金额尚未公布。据 OpenAI 官方表示,Global Illumination 团队现已加入 OpenAI,致力于开发包括 ChatGPT 在内的核心产品。Global Illumination 是一家数字产品公司,成立于 2021 年,创始人均来自 Instagram 和 Facebook。
5、文心一言现已上线百度搜索、文档摘要、文本转视频等 5 个原生插件
深度学习技术及应用国家工程研究中心 8 月 16 日举行 WAVE SUMMIT 深度学习开发者大会,百度首席技术官王海峰在大会上表示,文心一言大模型现已上线 5 个原生插件:百度搜索、览卷文档、E 言易图、说图解画、一镜流影。同时,文心一言现已支持一次同时使用 3 个插件,官方称在扩展大模型能力边界的同时,更能适应场景需要。
上述插件官方简介如下(除百度搜索):
览卷文档 : 原 ChatFile,可基于文档完成摘要、问答、创作等任务。
一镜流影:AI 文字转视频,从主题词、语句、段落篇章等文字描述内容,一键创作生成视频。
E 言易图:基于 Apache Echarts 为您提供数据洞察和图表制作,目前支持柱状图、折线图、饼图、雷达图、散点图、漏斗图、思维导图(树图)。
说图解画:基于图片进行文字创作、回答问题,可帮助用户写文案、想故事。
6、微软 Win11 应用商店推出 AI 摘要功能,可根据 App 评价生成总结
微软应用商店“AI 摘要”功能现已向美国用户正式推出。该功能旨在为用户提供一种快速、简单的方式来概括和总结人们对某款 App 的评价以及观点,为想要下载该 App 的用户提供参考。据报道,“AI 摘要”功能能够同时抓取对 App 的正面、负面评价,包括部分“评价很高”的 App 或游戏。该功能可以在几秒钟内将一个应用的数千条在线评论总结成一段精练的文字,突出显示最重要的观点。这对于用户在选择和下载新的应用和游戏时,参考和收集用户反馈非常有用。(来源:IT 之家)
7、Gartner 报告称生成式 AI 已达到“膨胀预期峰值”,即将跌入“幻灭的低谷”
市场调查机构 Gartner 近日发布报告,以生成式 AI 的炒作周期(Hype Cycle)来看,目前已达到“膨胀预期峰值”。该机构将生成式 AI 的炒作周期划分为创新触发器(Innovation Trigger)、“膨胀预期峰值”(Peak of Inflated Expectations)、“幻灭的低谷”(Trough of Disillusionment)、“启蒙的斜坡”(Slope of Enlightenment)和“生产力的高原”(Plateau of Productivity)5 个阶段。(来源:IT 之家)
8、微脉发布大语言模型健康管理应用“CareGPT”
据上证报报道,全病程管理平台微脉发布健康管理领域大语言模型应用——CareGPT。据微脉技术中心总经理海马(花名)介绍,CareGPT 将语言大模型 AI 技术与一系列工程调优技术以及全病程管理相结合,目前参数规模为 70 亿,可支持医疗健康场景下的多模态输入和输出。
9、消息称谷歌正在开发生活辅助 AI 工具,可当作私人管家
据《纽约时报》报道称,谷歌团队成员目前还在开发另一款未命名的 AI 工具,这款工具更注重于“私人护理”,可为用户担任“私人管家”,为用户提供“个人生活建议”。据悉,谷歌的新 AI 工具可以针对“这种特殊情况”结合用户本身信息,提供一系列“最恰当的”建议。外媒同时表示,未来谷歌还可以结合个人信息,为不同人提供一系列财务建议、帮助人们学习新技能的教程,或为用户智能提供一系列“膳食计划”。(来源:IT 之家)
10、消息称前谷歌 CEO 施密特正筹备新 AI 非营利组织
根据国外科技媒体 semafor 报道,前谷歌首席执行官埃里克・施密特(Eric Schmidt)目前正在筹建新的 AI 公司,借助 AI 技术应对科学挑战。报道称新公司定位为非营利组织,施密特已经聘请了两位业内极富声望的科学家来领导。IT 之家在此附上两位科学家的名称如下:
塞缪尔・罗德里(Samuel Rodriques):弗朗西斯・克里克研究所(Francis Crick Institute)应用生物技术实验室的创始人。
安德鲁・怀特(Andrew White):罗切斯特大学的教授,也是人工智能在化学中应用的先驱。
知情人士透露该组织计划以 OpenAI 为蓝本,吸引科学和人工智能领域的顶尖人才,融合两个领域的技术,希望在药物研发、材料科学等方面取得突破。知情人士表示该非营利组织的运营资金均来自施密特个人资产,但鉴于该项目的愿景,预估后续将吸纳更多外部资金。知情人士说,该项目仍处于早期阶段,确切的计划可能会改变。
11、字节跳动抖音子公司推出 AI 机器人“豆包”,基于云雀模型
字节跳动旗下 LLM 人工智能 机器人 “ 豆包”现已开始小范围邀请测试,用户可通过手机号、抖音或者 Apple ID 登录。据称,“豆包”是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台,iOS 以及安卓平台,但 iOS 需要使用 TestFlight 安装。(来源:IT 之家)
AI·新创
1、跨境电商迈入 AI 新时代,「Target Pilot」要做 AI 经营专家
Target Pilot 主要借助生成式 AI,打造基于自反馈大模型的垂直电商驱动引擎,来服务跨界电商营销。Target Pilot 致力于解决上述的行业痛点。李泼表示,研发团队基于 Meta 推出的开源大模型 LLaMA 2,开发了针对垂直电商领域的行业模型 TAMR Model,以该模型为基础的 AI 工具 Target Pilot,目标是成为电商卖家的线上智能经营专家。(来源:36 氪)
