仅 1.5B 大小的多模态模型UForm,能读图和聊天,由 llama-1.3B 和 ViT-B/16 组成

61次阅读
没有评论

共计 210 个字符,预计需要花费 1 分钟才能阅读完成。

UForm 是一个多模态的人工智能库,既灵活又高效。UForm 的微型嵌入模型将帮助您理解和搜索跨多种语言的视觉和文本内容。另一方面,UForm 的小型生成模型不仅支持对话和聊天应用场景,还能够进行图像字幕生成和视觉问答(VQA)。借助紧凑的自定义预训练 Transformer 模型,UForm 可以在从服务器集群到智能手机等各种设备上运行。

GitHub 地址:https://github.com/unum-cloud/uform

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-12-30发表,共计210字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。
评论(没有评论)
验证码