DeepSeek 私有化部署中模型服务的微调过程多任务联合训练的损失平衡方法? 热门官方
回答:采用梯度归一化(Gradient Normalization)或多任务权重动态调整策略,避免某一任务主导优化方向,提升整体性能。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读