369IT编程
  •  首页
  •  教程
  •  IT编程
  •  国外技术
  •  登录
  1. 标签
  2. 中科大中兴提出新后训练范式小尺寸多模态模型,成功复现R1推理
  • 中科大、中兴提出新后训练范式:小尺寸多模态模型,成功复现R1推理

    本文第一作者为邓慧琳,中国科学技术大学硕博连读四年级,研究方向为多模态模型视觉理解、推理增强(R1强化学习)、异常检测。在TAI、TASE、ICCV等期刊和顶会发表论文。近年来,随着大型语言模型(LLMs)的快速发展,多模态理解领域取得了前
    中科大中兴提出新后训练范式小尺寸多模态模型,成功复现R1推理
    admin10小时前
    50
CopyRight © 2022 All Rights Reserved
Processed: 0.022, SQL: 9