首页
教程
IT编程
国外技术
登录
标签
ALIGNMENT
KTO: Model Alignment as Prospect Theoretic Optimization
一、引言 本报告介绍了一种基于前景理论(Prospect Theory)的大型语言模型对齐方法 ——KTO(Kahneman-Tversky Optimization)。该方法通过设计人类感知损失函数(HALO),直接最大化模型生成的效用
ALIGNMENT
Model
KTO
optimization
Theoretic
admin
4月前
33
0
WHAT MAKES GOOD DATA FOR ALIGNMENT? A COMPREHENSIVE STUDY OF AUTOMATIC DATA SELECTION IN INSTRUCTION
这篇文章提出了DEITA的数据集筛选方法 进化复杂度 目前评估复杂度的几种方法: 随机选择 长度 困惑度 大模型评分 指令结点数 评分模型(Instag) IFD 本文的做法: 让GPT给一个指令增加复杂度,生成6段对应的文本。然后用GP
ALIGNMENT
Comprehensive
Good
DATA
Selection
admin
6月前
70
0