最新研究 多图像增强的直接偏好优化(MIA-DPO):一种用于大型视觉-语言模型的有效视觉偏好对齐方法 视觉偏好对齐涉及训练大型视觉 - 语言模型(LVLMs)以预测人类对视觉输入的偏好。现有的方法主要设计用于单图...