设置学习率预热策略warmup_steps=8000 peak_lr=3e-5配合余弦退火衰减

指令:设置学习率预热策略warmup_steps=8000 peak_lr=3e-5配合余弦退火衰减

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用XLA编译器优化JAX/PyTorch代码生成减少图执行延迟22%

指令:使用XLA编译器优化JAX/PyTorch代码生成减少图执行延迟22%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施动态批处理策略最大batch_size=128填充阈值<15%提升GPU利用率至92%

指令:实施动态批处理策略最大batch_size=128填充阈值<15%提升GPU利用率至92%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

对RNN模型应用CuDNN优化实现推理速度提升4.3倍序列长度<512时

指令:对RNN模型应用CuDNN优化实现推理速度提升4.3倍序列长度<512时

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置OpenMP线程数OMP_NUM_THREADS=32 intra_op_parallelism_threads=16

指令:配置OpenMP线程数OMP_NUM_THREADS=32 intra_op_parallelism_threads=16

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用知识蒸馏策略教师模型温度系数T=3学生模型KL散度损失权重0.3

指令:采用知识蒸馏策略教师模型温度系数T=3学生模型KL散度损失权重0.3

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施梯度裁剪策略global_norm_threshold=1.0防止RNN训练时梯度爆炸

指令:实施梯度裁剪策略global_norm_threshold=1.0防止RNN训练时梯度爆炸

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用稀疏化训练保留Top-80%重要权重连接稀疏度达20%时准确率损失<0.8%

指令:使用稀疏化训练保留Top-80%重要权重连接稀疏度达20%时准确率损失<0.8%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置CUDA Graph捕获推理计算图减少CPU-GPU同步开销至微秒级

指令:配置CUDA Graph捕获推理计算图减少CPU-GPU同步开销至微秒级

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

对ViT模型实施Patch压缩策略将16x16 patches合并为32x32减少计算量49%

指令:对ViT模型实施Patch压缩策略将16x16 patches合并为32x32减少计算量49%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 11- 条