DeepSeek 私有化部署中模型服务的模型微调过程断点续训实现细节? 热门官方
回答:保存 optimizer、scheduler、epoch、step 等状态至持久存储,恢复时按记录继续训练,避免重复计算。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读