LLM 后训练实践
第1课:后训练概述与SFT基础

第1课 推荐论文

第1课推荐阅读的 5 篇核心论文:Tülu 3、LoRA、QLoRA、LIMA、MAGPIE

核心论文列表

以下 5 篇论文覆盖了第 1 课的核心知识点:开源后训练流程、参数高效微调、数据质量与合成数据方法。建议按顺序阅读。

阅读建议

阅读优先级

  1. 必读:LoRA 和 LIMA——这两篇分别是参数高效微调和数据质量的核心论文,内容清晰易懂
  2. 推荐:Tülu 3——理解完整的后训练流程设计
  3. 选读:QLoRA 和 MAGPIE——深入理解量化微调和数据合成方法

扩展阅读