最新研究 创新迭代训练框架Self-Lengthen:提高大语言模型生成长文本的能力 大语言模型(LLMs)的最新进展显著增强了它们处理长上下文的能力,但在生成对齐的长输出方面仍然存在显著差距。这...
最新研究 PAPILLON:一个注重隐私的AI解决方案,融合了本地和专有模型,以提供安全且准确的语言模型输出 随着大语言模型(LLMs)如 ChatGPT 的普及,AI 在处理高度敏感信息的领域(如医疗保健、教育和个人发...
最新研究 新型FP8训练框架COAT:显著减少大模型训练中的内存占用,同时保持高性能 加州大学伯克利分校、英伟达、麻省理工学院和清华大学的研究人员共同提出了一种名为 COAT 的新型 FP8 训练...