369IT编程
  •  首页
  •  教程
  •  IT编程
  •  国外技术
  •  登录
  1. 标签
  2. KTO
  • KTO: Model Alignment as Prospect Theoretic Optimization

    一、引言 本报告介绍了一种基于前景理论(Prospect Theory)的大型语言模型对齐方法 ——KTO(Kahneman-Tversky Optimization)。该方法通过设计人类感知损失函数(HALO),直接最大化模型生成的效用
    ALIGNMENTModelKTOoptimizationTheoretic
    admin3月前
    240
CopyRight © 2022 All Rights Reserved
Processed: 0.026, SQL: 9