使用CUDA事件计时API测量内核执行时间精度±0.1ms

指令:使用CUDA事件计时API测量内核执行时间精度±0.1ms

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征标准化层ε=1e-7防止除零错误数值稳定

指令:实施特征标准化层ε=1e-7防止除零错误数值稳定

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型导出ONNX opset_version=13支持最新算子

指令:配置模型导出ONNX opset_version=13支持最新算子

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置梯度累积配合混合精度训练稳定大batch训练

指令:设置梯度累积配合混合精度训练稳定大batch训练

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施对抗样本检测置信度阈值<0.3标记可疑输入

指令:实施对抗样本检测置信度阈值<0.3标记可疑输入

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用稀疏矩阵存储格式CSR减少内存占用62%

指令:使用稀疏矩阵存储格式CSR减少内存占用62%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动混合精度保留Embedding层为FP32精度

指令:配置自动混合精度保留Embedding层为FP32精度

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型集成策略加权平均投票权重基于验证集性能

指令:实施模型集成策略加权平均投票权重基于验证集性能

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置分布式训练同步频率每100次迭代全局聚合

指令:设置分布式训练同步频率每100次迭代全局聚合

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用课程学习难度调整策略基于样本损失动态排序

指令:采用课程学习难度调整策略基于样本损失动态排序

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 61- 条