Q-Tuning

监督微调（SFT）正变得越来越重。过去，SFT 只是大模型训练流程中的一个轻量级收尾步骤；如今，它已演变为一场计算密集型任务，其数据规模和训练成本常常逼近中期预训练阶段。在有限算力预算下，如何高效利...

6个月前

01400