Nous-Hermes 2：基于Mixtral 8x7B，使用RLHF方式训练的LLM

44次阅读

共计 192 个字符，预计需要花费 1 分钟才能阅读完成。

Nous-Hermes 2：基于 Mixtral 8x7B，使用 RLHF 方式训练的 LLM，能力全面超越 Mixtral 8x7B。SFT 是普通微调版本，SFT+DPO 是 RLHF 微调版本，带有 GGUF 的是适配了 llama 架构的版本。

地址：https://huggingface.co/collections/NousResearch/hermes-650a66656fb511ba9ea86ff1

正文完

关注公众号获取最新教程

发表至：无分类

2024-01-17

转载说明：除特殊说明外本站文章皆由原创发布，请勿转载。

收集了4000 多种Midjourney艺术风格的图书馆midlibrary

上海AI实验室等开源书生·浦语2.0大模型

评论（没有评论）