Meta 研究人员通过将 AI 的慢思考结果蒸馏进快思考,显著提升了 Llama2 的性能,使其在多个任务上的表现超越了 GPT-4。这种技术模仿了人类系统 1 和系统 2 的思考方式,通过系统 2 生成数据微调系统 1 模型,提高了推理效率并降低了成本。四种不同的系统 2 方法在未标注数据集上生成推理结果,经过一致性和鲁棒性筛选后,形成高质量的蒸馏数据集,对系统 1 进行无监督微调。结果表明,微调后的系统 1 模型在输出质量上接近系统 2,但速度更快,Token 数量更少,适用于实时交互和移动设备部署。