使用NVIDIA Profiler识别内核执行时间>1ms的热点

指令:使用NVIDIA Profiler识别内核执行时间>1ms的热点

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征哈希技巧将高维类别特征映射到32位空间

指令:实施特征哈希技巧将高维类别特征映射到32位空间

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置模型服务QPS阈值=1000自动扩展副本数量

指令:配置模型服务QPS阈值=1000自动扩展副本数量

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置对抗训练PGD攻击步长alpha=0.01迭代次数10步

指令:设置对抗训练PGD攻击步长alpha=0.01迭代次数10步

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施模型量化后校准采用熵最小化方法确定阈值

指令:实施模型量化后校准采用熵最小化方法确定阈值

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

使用CUDA Graph实例化多个计算图并行执行不同分支

指令:使用CUDA Graph实例化多个计算图并行执行不同分支

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

配置自动批处理最小效率阈值utilization>85%触发合并

指令:配置自动批处理最小效率阈值utilization>85%触发合并

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实施特征选择基于SHAP值保留绝对值>0.1的重要特征

指令:实施特征选择基于SHAP值保留绝对值>0.1的重要特征

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

设置模型并行通信压缩比ratio=0.3减少跨GPU数据传输

指令:设置模型并行通信压缩比ratio=0.3减少跨GPU数据传输

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用渐进式调整策略初始batch_size=8按2倍指数增长

指令:采用渐进式调整策略初始batch_size=8按2倍指数增长

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 542 条记录,当前显示第 71- 条