【2023年12月23日AI晚报】OpenAI CEO发布2023年17条工作心得；阿里可控视频生成框架DreaMoving开放Demo

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]
[t-success icon='']AI·新创[/t-success]
- 1、2分钟定制Agent，「澜码科技」发布企业级AI Agent平台AskXBOT

[t-success icon='']AI·快讯[/t-success]

1、部分研究人员不使用 ChatGPT

AI 聊天机器人 ChatGPT 风靡世界，但《自然》的调查发现，78% 的研究人员不常用 ChatGPT 等生成式 AI 工具。而使用 ChatGPT 的研究人员通常将其用于与研究无关的有趣活动，或者只是做做实验。ChatGPT 使用群体给出的一个重要理由是：对非母语英语者非常有帮助，可以减少花在撰写邮件和文件的时间，有助于提高工作效率。但部分研究人员还是选择尽可能避开 ChatGPT。心理学者 Ada Kaluzna 说，如果我不写自己的研究，我还算是研究员吗？她认为使用 ChatGPT 有可能会破坏学习和创造性思维能力。很多人说除非写下来，他们不知道自己在想什么。写作能让你专注于主题，收集整理想法。如果不尝试以结构化的形式纪录想法，你可能无法创造出新观念。另一些研究人员不使用 ChatGPT 是因为它经常生成假的参考文档。爱尔兰科学家 Viswanath Vittaladevaram 称，ChatGPT 有助于获取基本信息，但不应该将其用于科学论文撰写。（来源）

2、OpenAI CEO发布2023年17条工作心得

OpenAI CEO萨姆·阿尔特曼（Sam Altman）在个人博客上发布了标题为《我希望有人告诉过我这些》（What I Wish Someone Had Told Me）的博客，提出17条商业建议，并称“希望这对那些在节日期间思考2024年要从事什么工作的人有所帮助”。阿尔特曼在文中提到：“乐观、执着、自信、强大的动力和人际关系是启动一切的关键。结果才是最重要的；不要让好的过程成为糟糕结果的借口。不要与商业物理定律作对。计划应以十年为单位，执行应以周为单位。”

3、微软Copilot将推出聊天记录置顶功能

据Microsoft 365路线图今日更新，Copilot将提供新的置顶聊天记录功能，方便之后再次访问，最多可固定15条。该功能将于明年1月开始预览，2月开始正式推出。

4、智源开源新一代多模态基础模型Emu2

据智源研究院微信公众号发文，昨日，智源研究院开源发布新一代多模态基础模型Emu2，通过大规模自回归生成式多模态预训练，显著推动多模态上下文学习能力的突破。Emu2在少样本多模态理解任务上大幅超越Flamingo-80B、IDEFICS-80B等主流多模态预训练大模型，在包括VQAv2、OKVQA、MSVD、MM-Vet、TouchStone在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。相较今年7月发布的第一代“多模态to多模态”Emu模型，Emu2使用了更简单的建模框架，训练了从编码器语义空间重建图像的解码器、并把模型规模化到37B参数实现模型能力和通用性上的突破。

项目主页：baaivision.github.io/emu2

5、百度推出文字解谜AI原生游戏“模问题”

百度于微信公众号宣布上线一款全新AI原生小游戏“模问题”，该游戏是基于文心大模型的能力而设计的一款文字解谜AI原生游戏。在游戏中，玩家需要通过调整输入适合的提示词（Prompt），使得大模型生成符合要求的正确答案，即可进入下一关。游戏共有30个关卡，包含丰富的题目类型，通关游戏还有机会获得文心一言专业版体验卡。

游戏地址：https://soss-apps.emerge.ltd/apps/wavesummit-2023-llm/index.html

6、阿里可控视频生成框架DreaMoving开放Demo

阿里通义实验室的可控视频生成框架DreaMoving开放Demo试用。据悉，DreaMoving是一种基于扩散的可控视频生成框架，用于生成高质量的定制人类视频。具体而言，给定目标身份和姿势序列，DreaMoving可以根据姿势序列生成目标身份在任何地方跳舞的视频。

项目主页：dreamoving.github.io/dreamoving

Demo地址：modelscope.cn/studios/vigen/video_generation/summary

7、2023年吴文俊AI科学技术奖初评通过项目公示

2023年度吴文俊AI科学技术奖发布初评通过项目名单并开启公示，公示期为12月21日至12月25日。公示结束后，学会奖励工作办公室将向需参加终评答辩的项目第一完成人或候选人发送答辩准备通知。据悉，“吴文俊AI科学技术奖”由中国AI学会发起主办，是我国智能科学技术领域唯一以人民科学家、AI开拓先驱、我国智能科学研究的开拓者和领军人、首届国家最高科学技术奖获得者、中国科学院院士、中国AI学会名誉理事长吴文俊先生命名，依托社会力量设立的科学技术奖，具备提名推荐国家科学技术奖资格，旨在奖励在智能科学研究中取得重要发现，着力实现原始创新与突破，或在AI领域攻克关键核心技术。

公示名单：caai.cn/index.php?s=/home/file/download/id/719.html

8、国内12家机构联合发表基础模型推理综述论文

香港中文大学、华为诺亚方舟实验室、香港大学、上海AI实验室等12家国内机构联合发表基础模型推理综述论文。论文提到，推理是复杂问题解决的关键能力，在谈判、医学诊断和刑事调查等各种实际场景中发挥着至关重要的作用。本文介绍了一些具有里程碑意义的基础模型，这些模型被提出或可适用于推理，并突出了各种推理任务、方法和基准的最新进展。然后，论文深入探讨了基础模型中推理能力出现的潜在未来方向，还讨论了在推理背景下多模态学习、自主代理和超级对齐的相关性。

论文地址：arxiv.org/pdf/2312.11562.pdf

9、移动通信与AI融合的数据格式和模型建议书发布

据5G推进组微信公众号今日发文，中国信息通信研究院移动通信创新中心联合华为、中兴通讯等九家单位联合撰写了《移动通信与AI融合的数据格式和模型建议书》。本次发布的建议书是数据格式和模型系列建议的第一阶段，主要是包含移动通信和AI在物理层融合的典型用例。建议书汇聚产业实践中业界最为关注的用例，涵盖用例智能化模型的训练数据集格式、训练数据集大小、模型类型、模型参数、模型占用内存、模型推理所需算力等关键信息，并分享实践中AI对移动通信系统性能的提升，供产学研用各界参考研究。

建议书下载地址：https://www.imt2030.org.cn/html/default/zhongwen/chengguofabu/yanjiubaogao/

10、国家大模型标准测试首批通过名单公布：含阿里通义千问、腾讯混元等

综合腾讯云、阿里云官方公众号，在 12 月 22 日的全国信息技术标准化技术委员会人工智能分委会全体会议期间，国内首个官方“大模型标准符合性评测”结果公布，腾讯混元大模型、阿里通义千问、360 智脑、百度文心一言成为首批通过评测的四款国产大模型。此外，腾讯云还以提案牵头方身份启动《人工智能模型即服务（MaaS）功能要求》的讨论与编制，推动MaaS领域标准化。

11、多名美国作家起诉人工智能公司OpenAI

据路透社报道，当地时间12月20日，包括泰勒·布兰奇和史戴西·希夫在内的11名美国作家在纽约曼哈顿联邦法院起诉美国人工智能公司“开放人工智能研究中心”（OpenAI）和微软，指控其滥用他们的作品来训练聊天机器人ChatGPT。这些作家向法庭表示，OpenAI在未经许可的情况下，从互联网上批量复制了他们的作品，并将这些作品纳入ChatGPT的训练数据里，侵犯了他们的作品版权。作家们向法院提出了金额不详的赔偿要求，并要求法院下令这些公司停止侵犯版权。

12、至少 5000 万美元，消息称苹果正购买新闻采集权用于训练生成式 AI

根据纽约时报报道，苹果公司已经和多家主要出版商达成协议，通过采集其相关新闻内容，以训练生成式 AI 系统。报告称苹果公司的目标，是和这些主要出版商达成多年合作协议，目前已经和康泰纳仕（Condé Nast）、NBC 新闻和 IAC 接洽。报道称，拟议的交易金额至少 5000 万美元（IT之家备注：当前约 3.57 亿元人民币），如果该协议达成，苹果可以采集上述出版商的媒体内容，用于培训生成式 AI。（来源：IT之家）

[t-success icon='']AI·新创[/t-success]

1、2分钟定制Agent，「澜码科技」发布企业级AI Agent平台AskXBOT

所谓基于大语言模型的AI Agent，可以被简单视作可以自主使用系统工具执行任务的智能体。Lilian Weng的贴文指出，“大语言模型、记忆、规划、工具使用”是AI Agent的四个关键组件——有了后三者的能力，大模型就不再只是一个ChatBOT，而能在工作、娱乐等更广阔的场景中发挥价值。在澜码科技CEO周健看来，AI Agent在To B场景中的最大价值是“复制专家的知识”。成立于2023年2月，澜码科技基于大语言模型的驱动，从而为企业定制研发“中间层” 的自动化运营中台，提供低代码/无代码的人机交互界面。（来源：36氪）

AI PC装机指南