Nous-Hermes 2:基于Mixtral 8x7B,使用RLHF方式训练的LLM

44次阅读
没有评论

共计 192 个字符,预计需要花费 1 分钟才能阅读完成。

Nous-Hermes 2:基于 Mixtral 8x7B,使用 RLHF 方式训练的 LLM,能力全面超越 Mixtral 8x7B。SFT 是普通微调版本,SFT+DPO 是 RLHF 微调版本,带有 GGUF 的是适配了 llama 架构的版本。

地址:https://huggingface.co/collections/NousResearch/hermes-650a66656fb511ba9ea86ff1

Nous-Hermes 2:基于 Mixtral 8x7B,使用 RLHF 方式训练的 LLM

正文完
关注公众号获取最新教程
post-qrcode
 
AI小诸葛
版权声明:本站原创文章,由 AI小诸葛 2024-01-17发表,共计192字。
转载说明:除特殊说明外本站文章皆由原创发布,请勿转载。
评论(没有评论)
验证码