采用课程学习策略基于验证损失动态调整学习率曲线

指令:采用课程学习策略基于验证损失动态调整学习率曲线

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用CUDA Graph捕获数据预处理与推理完整执行流程

指令:使用CUDA Graph捕获数据预处理与推理完整执行流程

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最小有效样本数确保统计显著性

指令:配置自动批处理最小有效样本数确保统计显著性

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型量化后校准采用分位数动态范围调整方法

指令:实施模型量化后校准采用分位数动态范围调整方法

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置对抗训练攻击强度随epoch数非线性衰减策略

指令:设置对抗训练攻击强度随epoch数非线性衰减策略

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用TensorRT支持动态shape配置多组opt_shape参数

指令:使用TensorRT支持动态shape配置多组opt_shape参数

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型监控漂移检测Wasserstein距离阈值>0.15

指令:配置模型监控漂移检测Wasserstein距离阈值>0.15

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征交叉网络自动发现非线性交互特征关系

指令:实施特征交叉网络自动发现非线性交互特征关系

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置模型并行通信压缩采用8-bit量化配合误差修正

指令:设置模型并行通信压缩采用8-bit量化配合误差修正

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用渐进式调整策略初始学习率1e-4阶梯式衰减

指令:采用渐进式调整策略初始学习率1e-4阶梯式衰减

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 501- 条