优化稀疏矩阵乘法,cuSPARSE优化算法,计算速度提升4x,稀疏格式转换开销<5%

指令:优化稀疏矩阵乘法,cuSPARSE优化算法,计算速度提升4x,稀疏格式转换开销<5%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用动态分辨率输入,多尺度自适应(Adaptive Resolution),计算量减少50%,小目标检测精度损失<1%

指令:采用动态分辨率输入,多尺度自适应(Adaptive Resolution),计算量减少50%,小目标检测精度损失<1%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实现模型冻结(Layer Freezing),早期层参数固定,微调速度提升3x,过拟合风险降低20%

指令:实现模型冻结(Layer Freezing),早期层参数固定,微调速度提升3x,过拟合风险降低20%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

构建计算图压缩,冗余节点合并,推理计算量减少25%,执行延迟降低10%

指令:构建计算图压缩,冗余节点合并,推理计算量减少25%,执行延迟降低10%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

优化数据预处理,SIMD指令加速(AVX-512),图像增强速度≥10M samples/秒,CPU占用率<20%

指令:优化数据预处理,SIMD指令加速(AVX-512),图像增强速度≥10M samples/秒,CPU占用率<20%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用稀疏化训练,随机掩码(Random Masking),激活稀疏度≥70%,FLOPs降低50%,精度损失<1%

指令:采用稀疏化训练,随机掩码(Random Masking),激活稀疏度≥70%,FLOPs降低50%,精度损失<1%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实现异步数据加载,双缓冲(Double Buffering),GPU等待时间<1ms,吞吐量提升2.5x

指令:实现异步数据加载,双缓冲(Double Buffering),GPU等待时间<1ms,吞吐量提升2.5x

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

构建内存高效注意力(Memory-Efficient Attention),显存占用降低70%,长序列支持≥64k tokens

指令:构建内存高效注意力(Memory-Efficient Attention),显存占用降低70%,长序列支持≥64k tokens

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

优化卷积计算,Grouped Convolution,参数量减少4x,特征图分离计算效率提升2x

指令:优化卷积计算,Grouped Convolution,参数量减少4x,特征图分离计算效率提升2x

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用梯度累积(Micro-Batching),虚拟大批量训练,小显存GPU支持≥1T参数,收敛稳定性提升15%

指令:采用梯度累积(Micro-Batching),虚拟大批量训练,小显存GPU支持≥1T参数,收敛稳定性提升15%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 157 条记录,当前显示第 51- 条