实施对抗样本生成采用CW攻击优化L2范数约束

指令:实施对抗样本生成采用CW攻击优化L2范数约束

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置混合精度训练的loss_scaling_factor=2^12初始动态缩放

指令:设置混合精度训练的loss_scaling_factor=2^12初始动态缩放

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用课程学习策略基于损失值动态调整样本出现频率

指令:采用课程学习策略基于损失值动态调整样本出现频率

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用CUDA原子操作优化稀疏矩阵更新减少竞争条件

指令:使用CUDA原子操作优化稀疏矩阵更新减少竞争条件

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最大token长度max_length=2048截断策略

指令:配置自动批处理最大token长度max_length=2048截断策略

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型量化感知训练校准数据分布匹配测试集统计量

指令:实施模型量化感知训练校准数据分布匹配测试集统计量

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置分布式训练梯度同步采用NCCL后端优化通信协议

指令:设置分布式训练梯度同步采用NCCL后端优化通信协议

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用TensorRT插件支持自定义稀疏矩阵乘法运算

指令:使用TensorRT插件支持自定义稀疏矩阵乘法运算

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型监控异常检测基于Z-score阈值±3σ标记离群值

指令:配置模型监控异常检测基于Z-score阈值±3σ标记离群值

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征工程生成交互特征通过笛卡尔积组合原始字段

指令:实施特征工程生成交互特征通过笛卡尔积组合原始字段

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 121- 条