设置模型并行将FFN层拆分到独立计算单元优化吞吐量

指令:设置模型并行将FFN层拆分到独立计算单元优化吞吐量

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用对抗训练策略结合随机权重扰动增强泛化能力

指令:采用对抗训练策略结合随机权重扰动增强泛化能力

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用NVIDIA A100支持TF32精度加速深度学习训练

指令:使用NVIDIA A100支持TF32精度加速深度学习训练

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动混合精度保留BatchNorm和Softmax为FP32精度

指令:配置自动混合精度保留BatchNorm和Softmax为FP32精度

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型剪枝后重训练采用余弦退火学习率调度

指令:实施模型剪枝后重训练采用余弦退火学习率调度

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置梯度累积配合混合精度训练稳定大规模参数更新

指令:设置梯度累积配合混合精度训练稳定大规模参数更新

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用稀疏矩阵存储格式CSC优化列优先访问模式

指令:使用稀疏矩阵存储格式CSC优化列优先访问模式

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型服务QoS保障优先处理高价值请求队列

指令:配置模型服务QoS保障优先处理高价值请求队列

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征选择基于互信息熵评估特征相关性

指令:实施特征选择基于互信息熵评估特征相关性

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置分布式训练数据加载采用内存映射文件加速IO

指令:设置分布式训练数据加载采用内存映射文件加速IO

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 491- 条