实施模型量化感知训练校准集样本数=1024动态范围调整

指令:实施模型量化感知训练校准集样本数=1024动态范围调整

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动混合精度保留BatchNorm为FP32精度损失<0.3%

指令:配置自动混合精度保留BatchNorm为FP32精度损失<0.3%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

对YOLOv8应用CSPDarknet骨干网络减少冗余计算38%

指令:对YOLOv8应用CSPDarknet骨干网络减少冗余计算38%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置学习率余弦退火周期epochs=100最小lr=1e-6

指令:设置学习率余弦退火周期epochs=100最小lr=1e-6

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施数据增强策略MixUp alpha=0.4 CutMix概率=0.5

指令:实施数据增强策略MixUp alpha=0.4 CutMix概率=0.5

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用NVIDIA Tensor Core优化GEMM计算利用率>90%

指令:使用NVIDIA Tensor Core优化GEMM计算利用率>90%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置分布式训练NCCL_DEBUG=INFO监控通信状态

指令:配置分布式训练NCCL_DEBUG=INFO监控通信状态

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型剪枝后微调epochs=5学习率=1e-5恢复性能

指令:实施模型剪枝后微调epochs=5学习率=1e-5恢复性能

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置自动批处理超时时间timeout_ms=100动态调整batch_size

指令:设置自动批处理超时时间timeout_ms=100动态调整batch_size

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用贝叶斯优化超参数搜索n_iter=50 acq_func='EI'

指令:采用贝叶斯优化超参数搜索n_iter=50 acq_func='EI'

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 51- 条