共计 429 个字符,预计需要花费 2 分钟才能阅读完成。
Adept 发布专门为数字代理设计的新的多模态模型 Adept Fuyu-Heavy,Fuyu-Heavy 号称是世界上第三强大的多模态模型,仅次于 GPT4-V 和 Gemini Ultra,后者的规模是它的 10-20 倍。Fuyu-Heavy 特别擅长于处理和理解不同类型的数据(如图像和文本),其中最引人注目的是它对用户界面的高效理解。
特点:
- 在多模态推理方面表现出色。我们认为其杀手级特性是 UI 理解能力,但它在更传统的多模态基准测试中也表现良好。特别是,Fuyu-Heavy 在 MMMU 基准测试中的得分甚至高于 Gemini Pro。
- 在标准的基于文本的基准测试中,尽管需要将部分能力用于图像建模,但它的表现与相同计算类别的模型相当或更优。
- 它展示了(经过一些修改)我们可以扩大 Fuyu 架构并收获所有相关的好处,包括处理任意大小 / 形状的图像以及高效地重用现有的 transformer 优化。
正文完
关注公众号获取最新教程
发表至:无分类
2024-01-26