logo logo
  • 首页
  • 📰AI晚报
  • 📚AI教程
    • OpenAI
    • 微软
    • 谷歌
    • Meta AI
    • AI语音
    • AI绘画
    • AI视频
  • 💡AI新品
  • 🛠AI合集
  • AI硬件
  • AI快讯
  • 🧭AI导航
  • 问题反馈
  • 首页
  • 📰AI晚报
  • 📚AI教程
    • OpenAI
    • 微软
    • 谷歌
    • Meta AI
    • AI语音
    • AI绘画
    • AI视频
  • 💡AI新品
  • 🛠AI合集
  • AI硬件
  • AI快讯
  • 🧭AI导航
  • 问题反馈
  1. 首页
  2. AI科普
  3. 最新研究
  4. 文章列表
阿里达摩院开源智能体CoI-Agent:一键生成科研 idea 的 AI 研究助手

最新研究 阿里达摩院开源智能体CoI-Agent:一键生成科研 idea 的 AI 研究助手

随着科学文献的爆炸性增长,研究人员面临的一个重大挑战是如何高效地跟踪最新进展并提出有意义的研究方向。近期,大语...

浏览:363次阅读 0个评论
最新研究 2024-10-25
多图像增强的直接偏好优化(MIA-DPO):一种用于大型视觉-语言模型的有效视觉偏好对齐方法

最新研究 多图像增强的直接偏好优化(MIA-DPO):一种用于大型视觉-语言模型的有效视觉偏好对齐方法

视觉偏好对齐涉及训练大型视觉 - 语言模型(LVLMs)以预测人类对视觉输入的偏好。现有的方法主要设计用于单图...

浏览:251次阅读 0个评论
最新研究 2024-10-25
混合模态实时语音助手Ichigo

最新研究 混合模态实时语音助手Ichigo

大语言模型在自然语言处理领域取得了显著成就,但在语音任务中的应用仍然面临诸多挑战。特别是,如何有效地整合音频和...

浏览:240次阅读 0个评论
最新研究 2024-10-24
Hugging Face 推出了开源的、无代码的工具/库AutoTrain

最新研究 Hugging Face 推出了开源的、无代码的工具/库AutoTrain

随着开源模型的快速发展,针对特定工业或开源应用在自定义数据集上训练(或微调)模型已成为开发解决方案的关键步骤。...

浏览:257次阅读 0个评论
最新研究 2024-10-24
基于 SAM 2的视频对象分割的技术SAM2Long:提高对长视频序列中对象的分割能力

最新研究 基于 SAM 2的视频对象分割的技术SAM2Long:提高对长视频序列中对象的分割能力

Segment Anything Model 2 (SAM 2) 是一个在图像和视频对象分割领域表现出色的基础...

浏览:183次阅读 0个评论
最新研究 2024-10-24
Meta-Chunking:通过更精细的文本分割策略,进一步优化RAG模型的表现

最新研究 Meta-Chunking:通过更精细的文本分割策略,进一步优化RAG模型的表现

检索增强生成(RAG)作为一种有效补充大语言模型(LLMs)的技术手段,近年来受到了广泛关注。然而,RAG 在...

浏览:295次阅读 0个评论
最新研究 2024-10-24
百川对齐技术详解

最新研究 百川对齐技术详解

百川对齐(Baichuan Alignment)是对百川系列模型所采用的对齐技术进行的一次详尽剖析。作为业内首...

浏览:306次阅读 0个评论
最新研究 2024-10-24
Meta联手顶尖学府推出新型框架Agent-to-Sim(ATS):通过分析长时间连续录制的视频资料,自动学习并构建三维空间内生物体(如动物或人类)的行为模型

最新研究 Meta联手顶尖学府推出新型框架Agent-to-Sim(ATS):通过分析长时间连续录制的视频资料,自动学习并构建三维空间内生物体(如动物或人类)的行为模型

Meta 公司与卡内基梅隆大学及加州大学伯克利分校的研究团队共同发布了一项创新成果——Agent-to-Sim...

浏览:177次阅读 0个评论
最新研究 2024-10-24
提升视觉语言模型(VLMs)中的“思维链”(CoT)推理能力

最新研究 提升视觉语言模型(VLMs)中的“思维链”(CoT)推理能力

视觉语言模型(Vision Language Models,简称 VLMs)在多模态任务中表现出色,但其推理能...

浏览:268次阅读 0个评论
最新研究 2024-10-24
MINIPLM:高效、灵活、有效的预训练语言模型知识蒸馏框架

最新研究 MINIPLM:高效、灵活、有效的预训练语言模型知识蒸馏框架

知识蒸馏(Knowledge Distillation,简称 KD)是一种常用的技术,用于训练小型、高性能的学...

浏览:217次阅读 0个评论
最新研究 2024-10-24
动态压缩方法EvoPress:通过动态调整模型的压缩级别来优化大型视频理解模型

最新研究 动态压缩方法EvoPress:通过动态调整模型的压缩级别来优化大型视频理解模型

大语言模型(LLMs)的高计算成本促使研究人员探索各种压缩方法,如量化、稀疏化和结构化修剪。这些方法旨在减少模...

浏览:190次阅读 0个评论
最新研究 2024-10-24
用于视频的多模态语言模型xGen-MM-Vid(BLIP-3-Video):用于高效捕捉多帧之间的时间信息

最新研究 用于视频的多模态语言模型xGen-MM-Vid(BLIP-3-Video):用于高效捕捉多帧之间的时间信息

Salesforce AI 研究所推出一种用于视频的多模态语言模型 xGen-MM-Vid(BLIP-3-Vi...

浏览:198次阅读 0个评论
最新研究 2024-10-24
  • «
  • 1
  • ...
  • 3
  • 4
  • 5
  • 6
  • 7
  • »
文章搜索
热门文章
随机文章
Copyright 2023 | 版权所有:AI·新世界| 皖ICP备18025588号-3 | 网站托管于:腾讯云
 Theme by Puock