369IT编程
  •  首页
  •  教程
  •  IT编程
  •  国外技术
  •  登录
  1. 标签
  2. 解密prompt系列51 R1实验的一些细节讨论
  • 解密prompt系列51. R1实验的一些细节讨论

    DeepSeek R1出来后业界都在争相复现R1的效果,这一章我们介绍两个复现项目SimpleRL和LogicRL,还有研究模型推理能力的Cognitive Behaviour,项目在复现R1的同时还针对R1训练策略中的几个关键点进行了讨论
    解密prompt系列51 R1实验的一些细节讨论
    admin1天前
    80
CopyRight © 2022 All Rights Reserved
Processed: 0.014, SQL: 9