共计 192 个字符,预计需要花费 1 分钟才能阅读完成。
Nous-Hermes 2:基于 Mixtral 8x7B,使用 RLHF 方式训练的 LLM,能力全面超越 Mixtral 8x7B。SFT 是普通微调版本,SFT+DPO 是 RLHF 微调版本,带有 GGUF 的是适配了 llama 架构的版本。
地址:https://huggingface.co/collections/NousResearch/hermes-650a66656fb511ba9ea86ff1
正文完
关注公众号获取最新教程
![post-qrcode](https://pic.gametop10.cn/wp-content/uploads/2023/04/1680444958-weixinG.jpg)
发表至:无分类
2024-01-17