LLM 后训练实践
第2课:SFT进阶

第2课 推荐论文

第2课推荐阅读的 5 篇核心论文:SFT 超参数指南、Self-Instruct、MT-Bench、UltraChat、Deita

核心论文列表

以下 5 篇论文覆盖了第 2 课的核心知识点:SFT 超参数实践、指令数据构建方法、LLM 评估框架和数据高效选择策略。

阅读建议

阅读优先级

  1. 必读:Pareja 等 (SFT 超参数指南) 和 Zheng 等 (MT-Bench)——这两篇直接指导本课实验
  2. 推荐:Self-Instruct——理解指令数据合成的基本思路
  3. 选读:UltraChat 和 Deita——深入了解数据构建和数据选择方法

扩展阅读