本文详细描述了在苹果MAC笔记本上对DeepSeek-R1-Distill-Llama-1.5BQwen模型进行高效微调的流程。通过使用transformers库完成数据预处理,确保数据格式适配模型训练需求。同时,采用LoRA技术优化模型参数,增强其泛化能力与适应性。此外,借助WandB工具实时监控训练状态,跟踪性能表现。预训练模型则从ModelScope平台下载,为微调提供基础支持,从而全面提升模型推理效率与性能。
MAC微调模型LoRA技术WandB工具数据预处理ModelScope平台
2025-04-30