DeepSeek 私有化部署中模型服务的模型蒸馏温度参数调节原则? 热门官方
回答:教师模型输出 soft labels 时,温度越高分布越平滑,利于学生模型学习类别间关联;过高会降低置信度,需实验确定最佳值。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读