logo logo
  • 首页
  • 📰AI晚报
  • 📚AI教程
    • OpenAI
    • 微软
    • 谷歌
    • Meta AI
    • AI语音
    • AI绘画
    • AI视频
  • 💡AI新品
  • 🛠AI合集
  • AI硬件
  • AI快讯
  • 🧭AI导航
  • 问题反馈
  • 首页
  • 📰AI晚报
  • 📚AI教程
    • OpenAI
    • 微软
    • 谷歌
    • Meta AI
    • AI语音
    • AI绘画
    • AI视频
  • 💡AI新品
  • 🛠AI合集
  • AI硬件
  • AI快讯
  • 🧭AI导航
  • 问题反馈
  1. 首页
  2. AI科普
  3. 文章列表
最新研究
百川对齐技术详解

最新研究 百川对齐技术详解

百川对齐(Baichuan Alignment)是对百川系列模型所采用的对齐技术进行的一次详尽剖析。作为业内首...

浏览:514次阅读 0个评论
最新研究 2024-10-24
Meta联手顶尖学府推出新型框架Agent-to-Sim(ATS):通过分析长时间连续录制的视频资料,自动学习并构建三维空间内生物体(如动物或人类)的行为模型

最新研究 Meta联手顶尖学府推出新型框架Agent-to-Sim(ATS):通过分析长时间连续录制的视频资料,自动学习并构建三维空间内生物体(如动物或人类)的行为模型

Meta 公司与卡内基梅隆大学及加州大学伯克利分校的研究团队共同发布了一项创新成果——Agent-to-Sim...

浏览:350次阅读 0个评论
最新研究 2024-10-24
提升视觉语言模型(VLMs)中的“思维链”(CoT)推理能力

最新研究 提升视觉语言模型(VLMs)中的“思维链”(CoT)推理能力

视觉语言模型(Vision Language Models,简称 VLMs)在多模态任务中表现出色,但其推理能...

浏览:461次阅读 0个评论
最新研究 2024-10-24
MINIPLM:高效、灵活、有效的预训练语言模型知识蒸馏框架

最新研究 MINIPLM:高效、灵活、有效的预训练语言模型知识蒸馏框架

知识蒸馏(Knowledge Distillation,简称 KD)是一种常用的技术,用于训练小型、高性能的学...

浏览:374次阅读 0个评论
最新研究 2024-10-24
动态压缩方法EvoPress:通过动态调整模型的压缩级别来优化大型视频理解模型

最新研究 动态压缩方法EvoPress:通过动态调整模型的压缩级别来优化大型视频理解模型

大语言模型(LLMs)的高计算成本促使研究人员探索各种压缩方法,如量化、稀疏化和结构化修剪。这些方法旨在减少模...

浏览:363次阅读 0个评论
最新研究 2024-10-24
用于视频的多模态语言模型xGen-MM-Vid(BLIP-3-Video):用于高效捕捉多帧之间的时间信息

最新研究 用于视频的多模态语言模型xGen-MM-Vid(BLIP-3-Video):用于高效捕捉多帧之间的时间信息

Salesforce AI 研究所推出一种用于视频的多模态语言模型 xGen-MM-Vid(BLIP-3-Vi...

浏览:343次阅读 0个评论
最新研究 2024-10-24
新型视觉冗余减少策略PyramidDrop:提高大型视觉语言模型(LVLMs)效率的新策略

最新研究 新型视觉冗余减少策略PyramidDrop:提高大型视觉语言模型(LVLMs)效率的新策略

大型视觉语言模型(LVLMs)能够处理图像和文本,实现多模态理解和生成任务。然而,图像作为输入携带了丰富的信息...

浏览:437次阅读 0个评论
最新研究 2024-10-24
Cohere 推出多模态嵌入Embed 3:增强企业搜索能力

最新研究 Cohere 推出多模态嵌入Embed 3:增强企业搜索能力

Cohere 最近在其搜索模型中添加了多模态嵌入功能,允许用户将图像和文本数据部署到检索增强生成(RAG)风格...

浏览:386次阅读 0个评论
最新研究 2024-10-23
Google DeepMind推出扩散模型预测控制(D-MPC):结合多步动作提案和动力学模型

最新研究 Google DeepMind推出扩散模型预测控制(D-MPC):结合多步动作提案和动力学模型

模型预测控制(MPC)是一种利用动力学模型和规划器在规划时域内最大化目标函数来选择动作的方法。MPC 的灵活性...

浏览:549次阅读 0个评论
最新研究 2024-10-22
基于音频的端到端会话模型Mini-Omni2:能够实现实时语音互动

最新研究 基于音频的端到端会话模型Mini-Omni2:能够实现实时语音互动

GPT-4o 是一个包罗万象的多模态语言模型,能够理解视觉、听觉和文本模态,并直接输出音频,支持灵活的双工交互...

浏览:484次阅读 0个评论
最新研究 2024-10-22
Diffusion Curriculum (DisCL):通过图像引导实现合成到真实的生成课程学习

最新研究 Diffusion Curriculum (DisCL):通过图像引导实现合成到真实的生成课程学习

在深度学习领域,低质量或稀缺的数据一直是训练高效模型的主要障碍。传统的数据增强方法往往只能提供有限的帮助,而无...

浏览:444次阅读 0个评论
最新研究 2024-10-21
IBM 推出第三代 Granite 大语言模型Granite 3.0,加速企业 AI 发展

最新研究 IBM 推出第三代 Granite 大语言模型Granite 3.0,加速企业 AI 发展

IBM 在企业 AI 领域的布局正在加速。今天,IBM 宣布推出第三代 Granite 大语言模型(LLMs)...

浏览:382次阅读 0个评论
最新研究 2024-10-21
  • «
  • 1
  • ...
  • 4
  • 5
  • 6
  • 7
  • 8
  • ...
  • 27
  • »
文章搜索
热门文章
随机文章
Copyright 2023 | 版权所有:AI·新世界| 皖ICP备18025588号-3 | 网站托管于:腾讯云
 Theme by Puock