Sapient Intelligence:新加坡首家基础模型AI初创公司,引领新一代AI架构

浏览:465次阅读
没有评论

共计 1784 个字符,预计需要花费 5 分钟才能阅读完成。

新加坡的 Sapient Intelligence 近期宣布成功完成 2200 万美元的种子轮融资,估值达到 2 亿美元。此次融资由 Vertex Ventures、Sumitomo Group 和 JAFCO 等知名投资者支持。Sapient 的目标是在 AI 开发中开辟一条独特的道路,解决当前大语言模型(LLM)尤其是 GPT 风格模型难以处理的复杂和长期推理任务。

超越传统 Transformer 的新架构

联合创始人兼首席执行官 Austin Zheng在最近的一次采访中表示,Sapient 的创新之处在于开发了一种受神经科学和数学启发的新模型架构,将 Transformer 组件与循环神经网络(RNN)结构相结合,模仿人脑的工作方式。这种设计使得 Sapient 的模型能够更有效地处理多步骤推理和复杂问题。

  • 自回归方法的局限性:传统的 GPT 风格模型依赖于自回归方法,通过在先前输出上逐步构建来生成预测。虽然这种方法在一般任务中表现良好,但在多步骤推理和复杂问题解决方面存在困难,容易出现“幻觉”现象。
  • Sapient 的解决方案:Sapient 的模型通过持续评估解决方案、计算选项并根据这些选项提供奖励,能够在企业或生产环境中部署,并通过试错不断学习和改进。这种设计使得模型可以灵活地处理广泛的任务,精确且可靠。

基准测试中的卓越表现

Sapient 的模型在多个基准测试中表现出色,尤其是在解决数独、二维导航和复杂数学问题等任务中。Zheng 指出,Sapient 的模型在解决数独方面的准确率达到了 95%,无需使用中间工具和数据,这是目前市场上表现最好的神经网络之一。

  • 数独基准测试:其他领先模型需要通过中间步骤进行训练才能解决数独谜题,而 Sapient 的模型只需提供未完成的数独棋盘、规则和最终解决方案,便能通过试错自行推断如何解决。
  • 其他任务:Sapient 的模型在二维导航和复杂数学问题解决等任务中也表现出色,始终优于竞争方法。

高效的训练方法

Sapient 的训练方法显著降低了训练复杂模型的门槛。Zheng 解释说,与传统模型不同,Sapient 的模型只需要问答对进行训练,而不需要大量的高质量、逐步数据。此外,通过利用合成数据,Sapient 减少了对外部数据集的依赖,创建了可扩展且高效的训练管道。

实际应用:从代码到机器人

Sapient 的初始重点是现实世界的应用,主要集中在企业编码和机器人技术领域。

  • 自主编码代理:Sapient 已经在 Sumitomo 的企业环境中部署了一个自主 AI 编码代理,该代理能够学习公司的代码库,并最终开始维护和贡献代码。Zheng 将其描述为“智能且定制的 AI 员工和 AI 软件工程师”,可以帮助企业维护、更新并扩展现有的技术栈。
  • 具身 AI:Sapient 还在推进具身 AI 的研究,设计使机器人能够实时交互、学习和适应的模型。这将使机器人能够在理解环境、问题和用例方面持续改进,成为未来 1 - 2 年的主要研发方向。

全球视野与多元化团队

Sapient 不仅通过技术创新,还通过其全球化和包容性的方法使自己与众不同。公司希望成为首批解决真正具有挑战性问题的亚洲领导国际研究组织之一。Sapient 在新加坡设有办事处,并计划在湾区设立办事处,建立一个 AI 研究实验室,汇集多元化的观点和人才。

  • 团队背景:Sapient 的团队由来自 DeepMind、Anthropic 和微软 AI 等领先机构的科学家和工程师组成,反映了其国际化和多样化的理念。
  • 合作伙伴关系:Sapient 与 Sumitomo Group 等日本投资者建立了强大的合作伙伴关系,进一步增强了其在全球 AI 生态系统中的地位。

面向个人和企业的长期愿景

Sapient 的长期目标是开发能够为个人和企业带来同样有用结果的技术。Zheng 表示,最终目标是构建一个真正通用的代理,能够为用户解决日常任务,成为“全能代理解决方案”。这包括未来的面向公众的产品,如自主编码代理和通用个人助理。

  • 定价模式:目前,Sapient 专注于完善其技术和提供企业级解决方案。定价模式仍在探索中,可能包括许可、订阅费或与成功完成任务相关的收费。

Sapient Intelligence 通过其创新的 AI 架构和实际应用,正在快速崛起为全球 AI 领域中值得关注的公司。随着其技术的不断进步和全球布局的扩展,Sapient 有望在未来几年内成为 AI 领域的领导者。

正文完
关注公众号获取最新教程
post-qrcode
 0
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 于2024-12-11发表,共计1784字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。