使用稀疏化训练配合梯度估计策略保持参数更新稳定

指令:使用稀疏化训练配合梯度估计策略保持参数更新稳定

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型服务自动扩展基于预测流量的弹性策略

指令:配置模型服务自动扩展基于预测流量的弹性策略

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施对抗验证检测训练/测试分布差异KS统计量>0.3

指令:实施对抗验证检测训练/测试分布差异KS统计量>0.3

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置混合精度训练的dynamic_loss_scale更新策略自适应调整

指令:设置混合精度训练的dynamic_loss_scale更新策略自适应调整

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用课程学习策略基于样本年龄动态调整采样频率

指令:采用课程学习策略基于样本年龄动态调整采样频率

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用CUDA内核优化共享内存访问减少bank conflict

指令:使用CUDA内核优化共享内存访问减少bank conflict

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最小吞吐量保障机制满足实时需求

指令:配置自动批处理最小吞吐量保障机制满足实时需求

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型量化感知训练校准集包含极端案例样本

指令:实施模型量化感知训练校准集包含极端案例样本

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置分布式训练同步策略混合精度配合梯度压缩

指令:设置分布式训练同步策略混合精度配合梯度压缩

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用TensorRT INT8量化支持逐层动态阈值校准

指令:使用TensorRT INT8量化支持逐层动态阈值校准

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 371- 条