使用稀疏注意力机制将复杂度从O(n2)降至O(n√n)

指令:使用稀疏注意力机制将复杂度从O(n2)降至O(n√n)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型服务自动扩展基于队列长度的预测性伸缩

指令:配置模型服务自动扩展基于队列长度的预测性伸缩

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施对抗样本检测采用集成分类器投票机制

指令:实施对抗样本检测采用集成分类器投票机制

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置混合精度训练的grad_accumulation_steps=4配合AMP优化

指令:设置混合精度训练的grad_accumulation_steps=4配合AMP优化

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用课程学习策略基于样本复杂度动态调整损失权重

指令:采用课程学习策略基于样本复杂度动态调整损失权重

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用CUDA原子操作优化稀疏更新减少线程竞争

指令:使用CUDA原子操作优化稀疏更新减少线程竞争

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最大延迟约束确保服务等级协议SLA

指令:配置自动批处理最大延迟约束确保服务等级协议SLA

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型量化感知训练校准数据增强匹配真实场景分布

指令:实施模型量化感知训练校准数据增强匹配真实场景分布

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置分布式训练梯度同步采用异步更新配合动量补偿

指令:设置分布式训练梯度同步采用异步更新配合动量补偿

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用TensorRT插件支持自定义稀疏矩阵运算加速

指令:使用TensorRT插件支持自定义稀疏矩阵运算加速

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 191- 条