DeepSeek 私有化部署中模型服务的模型微调过程正则化策略选择? 热门官方
回答:可结合 L2、Dropout、Stochastic Depth 等方法,领域数据量少时倾向轻正则化防止欠拟合,数据充足时可适度增强防过拟合。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读