实施模型剪枝后微调采用Adam优化器配合warmup策略

指令:实施模型剪枝后微调采用Adam优化器配合warmup策略

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置梯度累积配合梯度检查点平衡显存与计算效率

指令:设置梯度累积配合梯度检查点平衡显存与计算效率

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用稀疏化训练配合动态掩码生成策略自适应调整密度

指令:使用稀疏化训练配合动态掩码生成策略自适应调整密度

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型服务QoS保障关键业务低延迟SLA<50ms

指令:配置模型服务QoS保障关键业务低延迟SLA<50ms

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征选择基于SHAP交互值识别特征协同效应

指令:实施特征选择基于SHAP交互值识别特征协同效应

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置分布式训练数据分片采用一致性哈希确保均衡分配

指令:设置分布式训练数据分片采用一致性哈希确保均衡分配

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用课程学习策略基于模型不确定性动态调整样本权重

指令:采用课程学习策略基于模型不确定性动态调整样本权重

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用CUDA流同步控制非阻塞操作实现计算IO重叠

指令:使用CUDA流同步控制非阻塞操作实现计算IO重叠

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最大token数动态调整基于可用显存容量

指令:配置自动批处理最大token数动态调整基于可用显存容量

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型量化后验证Recall@K指标下降<2.0%阈值

指令:实施模型量化后验证Recall@K指标下降<2.0%阈值

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 171- 条