联发科推出繁体中文 AI 大语言模型「BLOOM-zh」,如何使用&效果如何?

206次阅读
没有评论

共计 697 个字符,预计需要花费 2 分钟才能阅读完成。

ChatGPT 横空出世以后,各家公司都迫不及待的推出自家的大语言模型,但目前能媲美 ChatGPT 很少,芯片设计巨头联发科也在 4 月 28 日宣布旗下 AI 研究小组推出全球首个繁体中文 AI 大型语言模型(LLM)「BLOOM-zh」,这个模型起源于 BigScience 于 2022 年推出的开源 BLOOM 模型,团队对 BLOOM 进行了额外的繁体中文和英文 74 亿个 token 的扩展预训练,涵盖了新闻、书籍、百科全书、教材、口语等多个领域。

联发科推出繁体中文 AI 大语言模型「BLOOM-zh」,如何使用 & 效果如何?

联发科表示「BLOOM-zh」在大多数繁体中文基准测试中优于其前身 BigScience,同时保持其英语能力。联发科旗下 AI 研究小组在 ICLR 国际表征学习大会上发表了一篇论文,详细介绍了其使用 Fisher-Legendre(FishLeg)优化的新算法,可以比以前更快、更可靠地训练 AI 模型。该研究是与英国剑桥大学的神经动力学和控制组合作进行的。联发科 AI 研究小组将在 5 月 1 日的 ICLR 会议上展示这项成果。

BLOOM-zh 论文地址:https://arxiv.org/abs/2303.04715

BLOOM-zh 大模型:https://huggingface.co/ckip-joint

FishLeg 算法论文:https://openreview.net/forum?id=c9lAOPvQHS

FishLeg 开源页面:https://github.com/mtkresearch/FishLeg

结语:

目前释出的模型似乎并不是完全体,从搜索他人和自己的测试结果来看,目前的模型回答的答案很多都是驴头不对马嘴,代码什么的更是完全不支持,还是等等看今天官方正式发布再来看看效果如何!

联发科推出繁体中文 AI 大语言模型「BLOOM-zh」,如何使用 & 效果如何?

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2023-05-01发表,共计697字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。