Adept发布专门为数字代理设计的新的多模态模型Adept Fuyu-Heavy

42次阅读
没有评论

共计 429 个字符,预计需要花费 2 分钟才能阅读完成。

Adept 发布专门为数字代理设计的新的多模态模型 Adept Fuyu-Heavy,Fuyu-Heavy 号称是世界上第三强大的多模态模型,仅次于 GPT4-V 和 Gemini Ultra,后者的规模是它的 10-20 倍。Fuyu-Heavy 特别擅长于处理和理解不同类型的数据(如图像和文本),其中最引人注目的是它对用户界面的高效理解。

官方介绍:https://www.adept.ai/blog/adept-fuyu-heavy

Adept 发布专门为数字代理设计的新的多模态模型 Adept Fuyu-Heavy

特点:

  • 在多模态推理方面表现出色。我们认为其杀手级特性是 UI 理解能力,但它在更传统的多模态基准测试中也表现良好。特别是,Fuyu-Heavy 在 MMMU 基准测试中的得分甚至高于 Gemini Pro。
  • 在标准的基于文本的基准测试中,尽管需要将部分能力用于图像建模,但它的表现与相同计算类别的模型相当或更优。
  • 它展示了(经过一些修改)我们可以扩大 Fuyu 架构并收获所有相关的好处,包括处理任意大小 / 形状的图像以及高效地重用现有的 transformer 优化。
正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2024-01-26发表,共计429字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。
评论(没有评论)
验证码