13. 性能优化-用Numba加速Python数值计算,对比普通/向量化/Numba三种版本

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用C++重写Python热点函数(通过PyBind11暴露接口)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-实现数据库查询的索引优化

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用多进程加速CPU密集型任务

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-编写内存映射文件处理大数据的方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用Redis缓存高频访问数据

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-设计一个零拷贝数据传输方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-实现算法的并行化改造

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用GPU加速矩阵运算(CuPy)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-编写减少Python对象创建的最佳实践

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用异步IO提高网络请求吞吐量

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-设计一个预计算缓存系统

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-实现数据结构的缓存友好布局

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用Dask处理超出内存的数据集

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-编写减少Python函数调用开销的方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用连接池优化数据库访问

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-设计一个批量处理代替实时处理的方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-实现惰性加载优化启动性能

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用生成器替代列表处理大数据

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-编写减少锁竞争的并发方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用位运算优化条件判断

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-设计一个内存池管理方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-实现SIMD指令优化计算

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用LRU缓存优化重复计算

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-编写减少系统调用的优化方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用协程优化IO密集型任务

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-设计一个数据局部性优化方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-实现算法的近似计算加速

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用Pandas的eval优化复杂计算

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-编写减少分支预测失败的代码

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-用共享内存加速进程间通信

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

13. 性能优化-设计一个计算下推的优化方案

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实现模型推理延迟优化,P99<50ms,吞吐量≥10k QPS,采用KV Cache量化(INT4)+动态批处理

指令:实现模型推理延迟优化,P99<50ms,吞吐量≥10k QPS,采用KV Cache量化(INT4)+动态批处理

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

优化Transformer注意力机制,FlashAttention-2实现,显存占用降低40%,计算速度提升2.5x(H100 GPU)

指令:优化Transformer注意力机制,FlashAttention-2实现,显存占用降低40%,计算速度提升2.5x(H100 GPU)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

构建混合精度训练流水线,FP16/BF16混合精度,梯度缩放精度损失<0.001%,训练速度提升1.8x

指令:构建混合精度训练流水线,FP16/BF16混合精度,梯度缩放精度损失<0.001%,训练速度提升1.8x

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实现模型权重共享,跨层参数绑定(ALBERT风格),参数量减少35%,下游任务性能损失<1%

指令:实现模型权重共享,跨层参数绑定(ALBERT风格),参数量减少35%,下游任务性能损失<1%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

优化分布式训练通信,NCCL后端+Ring-AllReduce,带宽利用率≥92%,多节点扩展效率≥0.9

指令:优化分布式训练通信,NCCL后端+Ring-AllReduce,带宽利用率≥92%,多节点扩展效率≥0.9

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

采用模型剪枝策略,结构化剪枝(通道级)稀疏度≥70%,FLOPs降低60%,精度损失<0.5%(GLUE基准)

指令:采用模型剪枝策略,结构化剪枝(通道级)稀疏度≥70%,FLOPs降低60%,精度损失<0.5%(GLUE基准)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实现动态批处理(Dynamic Batching),请求合并延迟<10ms,GPU利用率≥85%,吞吐量提升3x

指令:实现动态批处理(Dynamic Batching),请求合并延迟<10ms,GPU利用率≥85%,吞吐量提升3x

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

优化内存管理,梯度检查点(Gradient Checkpointing)激活,显存占用降低50%,计算开销增加<15%

指令:优化内存管理,梯度检查点(Gradient Checkpointing)激活,显存占用降低50%,计算开销增加<15%

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

构建量化感知训练(QAT)流程,INT8量化模型精度损失<0.3%,推理速度提升3x(TensorRT部署)

指令:构建量化感知训练(QAT)流程,INT8量化模型精度损失<0.3%,推理速度提升3x(TensorRT部署)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

实现稀疏化训练,Top-K激活稀疏度≥80%,FLOPs减少45%,稀疏矩阵乘法优化(cuSPARSE)

指令:实现稀疏化训练,Top-K激活稀疏度≥80%,FLOPs减少45%,稀疏矩阵乘法优化(cuSPARSE)

支持:度飞飞 腾讯混元 DeepSeek ChatGpt 纳米 豆包 MiniMax

合成:原始指令 头尾合成 大纲指令 详情指令 专业科研 关联指令

共 157 条记录,当前显示第 1- 条