领域指令 - 度飞飞

13. 性能优化-用Numba加速Python数值计算，对比普通/向量化/Numba三种版本

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用C++重写Python热点函数（通过PyBind11暴露接口）

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-实现数据库查询的索引优化

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用多进程加速CPU密集型任务

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-编写内存映射文件处理大数据的方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用Redis缓存高频访问数据

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-设计一个零拷贝数据传输方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-实现算法的并行化改造

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用GPU加速矩阵运算（CuPy）

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-编写减少Python对象创建的最佳实践

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用异步IO提高网络请求吞吐量

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-设计一个预计算缓存系统

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-实现数据结构的缓存友好布局

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用Dask处理超出内存的数据集

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-编写减少Python函数调用开销的方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用连接池优化数据库访问

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-设计一个批量处理代替实时处理的方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-实现惰性加载优化启动性能

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用生成器替代列表处理大数据

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-编写减少锁竞争的并发方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用位运算优化条件判断

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-设计一个内存池管理方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-实现SIMD指令优化计算

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用LRU缓存优化重复计算

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-编写减少系统调用的优化方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用协程优化IO密集型任务

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-设计一个数据局部性优化方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-实现算法的近似计算加速

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用Pandas的eval优化复杂计算

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-编写减少分支预测失败的代码

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-用共享内存加速进程间通信

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

13. 性能优化-设计一个计算下推的优化方案

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

实现模型推理延迟优化，P99<50ms，吞吐量≥10k QPS，采用KV Cache量化（INT4）+动态批处理

指令：实现模型推理延迟优化，P99<50ms，吞吐量≥10k QPS，采用KV Cache量化（INT4）+动态批处理

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

优化Transformer注意力机制，FlashAttention-2实现，显存占用降低40%，计算速度提升2.5x（H100 GPU）

指令：优化Transformer注意力机制，FlashAttention-2实现，显存占用降低40%，计算速度提升2.5x（H100 GPU）

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

构建混合精度训练流水线，FP16/BF16混合精度，梯度缩放精度损失<0.001%，训练速度提升1.8x

指令：构建混合精度训练流水线，FP16/BF16混合精度，梯度缩放精度损失<0.001%，训练速度提升1.8x

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

实现模型权重共享，跨层参数绑定（ALBERT风格），参数量减少35%，下游任务性能损失<1%

指令：实现模型权重共享，跨层参数绑定（ALBERT风格），参数量减少35%，下游任务性能损失<1%

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

优化分布式训练通信，NCCL后端+Ring-AllReduce，带宽利用率≥92%，多节点扩展效率≥0.9

指令：优化分布式训练通信，NCCL后端+Ring-AllReduce，带宽利用率≥92%，多节点扩展效率≥0.9

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

采用模型剪枝策略，结构化剪枝（通道级）稀疏度≥70%，FLOPs降低60%，精度损失<0.5%（GLUE基准）

指令：采用模型剪枝策略，结构化剪枝（通道级）稀疏度≥70%，FLOPs降低60%，精度损失<0.5%（GLUE基准）

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

实现动态批处理（Dynamic Batching），请求合并延迟<10ms，GPU利用率≥85%，吞吐量提升3x

指令：实现动态批处理（Dynamic Batching），请求合并延迟<10ms，GPU利用率≥85%，吞吐量提升3x

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

优化内存管理，梯度检查点（Gradient Checkpointing）激活，显存占用降低50%，计算开销增加<15%

指令：优化内存管理，梯度检查点（Gradient Checkpointing）激活，显存占用降低50%，计算开销增加<15%

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

构建量化感知训练（QAT）流程，INT8量化模型精度损失<0.3%，推理速度提升3x（TensorRT部署）

指令：构建量化感知训练（QAT）流程，INT8量化模型精度损失<0.3%，推理速度提升3x（TensorRT部署）

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

实现稀疏化训练，Top-K激活稀疏度≥80%，FLOPs减少45%，稀疏矩阵乘法优化（cuSPARSE）

指令：实现稀疏化训练，Top-K激活稀疏度≥80%，FLOPs减少45%，稀疏矩阵乘法优化（cuSPARSE）

支持：度飞飞腾讯混元 DeepSeek ChatGpt 纳米豆包 MiniMax

合成：原始指令头尾合成大纲指令详情指令专业科研关联指令

🎯 度飞飞 🤖 DeepSeek 🏆 腾讯混元 🌟 纳米 ⚡ MiniMax

编程开发提示词库

13. 性能优化-用Numba加速Python数值计算，对比普通/向量化/Numba三种版本

13. 性能优化-用C++重写Python热点函数（通过PyBind11暴露接口）

13. 性能优化-实现数据库查询的索引优化

13. 性能优化-用多进程加速CPU密集型任务

13. 性能优化-编写内存映射文件处理大数据的方案

13. 性能优化-用Redis缓存高频访问数据

13. 性能优化-设计一个零拷贝数据传输方案

13. 性能优化-实现算法的并行化改造

13. 性能优化-用GPU加速矩阵运算（CuPy）

13. 性能优化-编写减少Python对象创建的最佳实践

13. 性能优化-用异步IO提高网络请求吞吐量

13. 性能优化-设计一个预计算缓存系统

13. 性能优化-实现数据结构的缓存友好布局

13. 性能优化-用Dask处理超出内存的数据集

13. 性能优化-编写减少Python函数调用开销的方案

13. 性能优化-用连接池优化数据库访问

13. 性能优化-设计一个批量处理代替实时处理的方案

13. 性能优化-实现惰性加载优化启动性能

13. 性能优化-用生成器替代列表处理大数据

13. 性能优化-编写减少锁竞争的并发方案

13. 性能优化-用位运算优化条件判断

13. 性能优化-设计一个内存池管理方案

13. 性能优化-实现SIMD指令优化计算

13. 性能优化-用LRU缓存优化重复计算

13. 性能优化-编写减少系统调用的优化方案

13. 性能优化-用协程优化IO密集型任务

13. 性能优化-设计一个数据局部性优化方案

13. 性能优化-实现算法的近似计算加速

13. 性能优化-用Pandas的eval优化复杂计算

13. 性能优化-编写减少分支预测失败的代码

13. 性能优化-用共享内存加速进程间通信

13. 性能优化-设计一个计算下推的优化方案

实现模型推理延迟优化，P99<50ms，吞吐量≥10k QPS，采用KV Cache量化（INT4）+动态批处理

优化Transformer注意力机制，FlashAttention-2实现，显存占用降低40%，计算速度提升2.5x（H100 GPU）

构建混合精度训练流水线，FP16/BF16混合精度，梯度缩放精度损失<0.001%，训练速度提升1.8x

实现模型权重共享，跨层参数绑定（ALBERT风格），参数量减少35%，下游任务性能损失<1%

优化分布式训练通信，NCCL后端+Ring-AllReduce，带宽利用率≥92%，多节点扩展效率≥0.9

采用模型剪枝策略，结构化剪枝（通道级）稀疏度≥70%，FLOPs降低60%，精度损失<0.5%（GLUE基准）

实现动态批处理（Dynamic Batching），请求合并延迟<10ms，GPU利用率≥85%，吞吐量提升3x

优化内存管理，梯度检查点（Gradient Checkpointing）激活，显存占用降低50%，计算开销增加<15%

构建量化感知训练（QAT）流程，INT8量化模型精度损失<0.3%，推理速度提升3x（TensorRT部署）

实现稀疏化训练，Top-K激活稀疏度≥80%，FLOPs减少45%，稀疏矩阵乘法优化（cuSPARSE）