实施模型剪枝后微调采用学习率warmup前10epoch

指令:实施模型剪枝后微调采用学习率warmup前10epoch

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置梯度累积配合混合精度训练稳定大batch参数更新

指令:设置梯度累积配合混合精度训练稳定大batch参数更新

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用稀疏矩阵乘法优化将计算复杂度降至O(nnz)

指令:使用稀疏矩阵乘法优化将计算复杂度降至O(nnz)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型服务QoS保障关键业务优先处理队列

指令:配置模型服务QoS保障关键业务优先处理队列

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征选择基于Permutation Importance评估贡献度

指令:实施特征选择基于Permutation Importance评估贡献度

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置分布式训练数据分片采用范围分区确保均衡

指令:设置分布式训练数据分片采用范围分区确保均衡

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用课程学习策略基于模型置信度动态调整权重

指令:采用课程学习策略基于模型置信度动态调整权重

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用CUDA流同步控制非阻塞操作实现计算与IO重叠

指令:使用CUDA流同步控制非阻塞操作实现计算与IO重叠

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最大延迟容忍度动态调整基于负载

指令:配置自动批处理最大延迟容忍度动态调整基于负载

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型量化后验证mAP指标下降<1.5%严格阈值

指令:实施模型量化后验证mAP指标下降<1.5%严格阈值

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 531- 条