logo logo
  • 首页
  • 📰AI晚报
  • 📚AI教程
    • OpenAI
    • 微软
    • 谷歌
    • Meta AI
    • AI语音
    • AI绘画
    • AI视频
  • 💡AI新品
  • 🛠AI合集
  • AI硬件
  • AI快讯
  • 🧭AI导航
  • 问题反馈
  • 首页
  • 📰AI晚报
  • 📚AI教程
    • OpenAI
    • 微软
    • 谷歌
    • Meta AI
    • AI语音
    • AI绘画
    • AI视频
  • 💡AI新品
  • 🛠AI合集
  • AI硬件
  • AI快讯
  • 🧭AI导航
  • 问题反馈
  1. 首页
  2. 标签
  3. 大语言模型
SemiKong:专为半导体行业打造的大语言模型

大语言模型 SemiKong:专为半导体行业打造的大语言模型

SemiKong 是由 Aitomatic 及其在“AI 联盟”中的合作伙伴共同开发的首款专门针对半导体行业的...

浏览:672次阅读 0个评论
大语言模型 2024-12-30
CLIP与大语言模型相结合的新方法LLM2CLIP:强大的语言模型解锁更丰富的视觉表现

微软 CLIP与大语言模型相结合的新方法LLM2CLIP:强大的语言模型解锁更丰富的视觉表现

在当今世界,CLIP 是最重要的多模态基础模型之一。通过在大规模图像 - 文本对上使用简单的对比学习损失,CL...

浏览:811次阅读 0个评论
微软 2024-11-16
在线数据混合方法Aioli:训练大语言模型的数据混合挑战及解决方案

最新研究 在线数据混合方法Aioli:训练大语言模型的数据混合挑战及解决方案

近年来,训练大语言模型面临着一个核心挑战:确定最佳的数据混合比例。例如,GPT-4 能够生成从法律文件到日常对...

浏览:464次阅读 0个评论
最新研究 2024-11-14
THANOS:通过融入“技能心智”增强对话代理的大语言模型

大语言模型 THANOS:通过融入“技能心智”增强对话代理的大语言模型

韩国科学技术研究院计算机学院和 KT 公司的研究人员通过将“技能心智”(skill-of-mind)的概念融入...

浏览:342次阅读 0个评论
大语言模型 2024-11-10
微调方法对预训练模型影响的研究

最新研究 微调方法对预训练模型影响的研究

微调是将预训练的大语言模型适应于特定下游任务的重要手段。最近,低秩适应(Low-Rank Adaptation...

浏览:453次阅读 0个评论
最新研究 2024-11-09
Defense Llama:美国首个专为国家安全构建的大语言模型

Meta AI Defense Llama:美国首个专为国家安全构建的大语言模型

近年来,加强国家安全的努力面临着诸多挑战,尤其是技术进步的速度远远超过了立法和官僚机构的适应速度。随着对技术的...

浏览:966次阅读 0个评论
Meta AI 2024-11-07
OpenAI推出预测输出功能,显著减少大语言模型延迟

OpenAI OpenAI推出预测输出功能,显著减少大语言模型延迟

延迟是大多数与大语言模型(LLM)相关用例中的一个重要问题。对于代码建议和修改长文档等场景,延迟确实会影响整体...

浏览:411次阅读 0个评论
OpenAI 2024-11-06
SelfCodeAlign:用于代码生成的大语言模型的自我对齐方法

最新研究 SelfCodeAlign:用于代码生成的大语言模型的自我对齐方法

指令微调是一种监督微调方法,显著提高了大语言模型(LLMs)遵循人类指令的能力。对于编程任务,大多数模型通过昂...

浏览:438次阅读 0个评论
最新研究 2024-11-02
JetBrains推出基于大语言模型生成证明的插件CoqPilot

AI编程 JetBrains推出基于大语言模型生成证明的插件CoqPilot

近年来,形式化软件验证在确保软件可靠性方面的重要性日益增加,特别是在航空航天工程、金融和医疗保健等关键领域。C...

浏览:395次阅读 0个评论
AI编程 2024-11-01
Meta 发布 MobileLLM:专为移动设备优化的大语言模型

Meta AI Meta 发布 MobileLLM:专为移动设备优化的大语言模型

大语言模型(LLMs)的广泛采用在对话式 AI、内容生成和设备应用等领域带来了显著进步。然而,对广泛云资源部署...

浏览:634次阅读 0个评论
Meta AI 2024-11-01
OpenAI 开源 SimpleQA 基准:用于评估大语言模型回答简短、寻求事实的问题的能力

OpenAI OpenAI 开源 SimpleQA 基准:用于评估大语言模型回答简短、寻求事实的问题的能力

大型语言模型的迅速发展带来了许多机遇,但也伴随着重大挑战,尤其是在确保生成响应的事实性方面。一个持续存在的问题...

浏览:416次阅读 0个评论
OpenAI 2024-11-01
大语言模型知道的比它们展示的多:关于大语言模型幻觉的内在表示

最新研究 大语言模型知道的比它们展示的多:关于大语言模型幻觉的内在表示

大语言模型(LLMs)因其生成错误或无意义输出的倾向而备受关注,这种现象通常被称为“幻觉”。尽管许多研究从用户...

浏览:373次阅读 0个评论
最新研究 2024-10-30
  • 1
  • 2
  • »
文章搜索
热门文章
随机文章
Copyright 2023 | 版权所有:AI·新世界| 皖ICP备18025588号-3 | 网站托管于:腾讯云
 Theme by Puock