设置模型并行通信优化采用Ring-AllReduce算法

指令:设置模型并行通信优化采用Ring-AllReduce算法

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用渐进式调整策略初始batch_size=2指数增长

指令:采用渐进式调整策略初始batch_size=2指数增长

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用NVIDIA DLProf分析内核执行热点优化计算效率

指令:使用NVIDIA DLProf分析内核执行热点优化计算效率

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最小吞吐量要求保障实时性指标

指令:配置自动批处理最小吞吐量要求保障实时性指标

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型剪枝保留连接权重贡献度>0.2的显著特征

指令:实施模型剪枝保留连接权重贡献度>0.2的显著特征

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置梯度检查点内存节省目标target_saving=0.35

指令:设置梯度检查点内存节省目标target_saving=0.35

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用稀疏注意力机制将复杂度从O(n2)降至O(nlogn)

指令:使用稀疏注意力机制将复杂度从O(n2)降至O(nlogn)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型服务自动扩展基于预测队列长度的弹性策略

指令:配置模型服务自动扩展基于预测队列长度的弹性策略

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施对抗样本检测采用集成分类器投票机制

指令:实施对抗样本检测采用集成分类器投票机制

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置混合精度训练的grad_clip_threshold=1.0防止异常梯度

指令:设置混合精度训练的grad_clip_threshold=1.0防止异常梯度

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 401- 条