主流框架包括:
训练框架:Megatron-LM(张量并行+流水线并行)、DeepSpeed(ZeRO优化+模型并行)、Colossal-AI(支持混合并行)、PyTorch FSDP( Fully Sharded Data Parallel,参数分片);
推理框架:vLLM(支持张量并行推理)、TensorRT-LLM(优化GPU推理分块)、Hugging Face Transformers(集成流水线并行接口)、Falcon(自研长上下文分块策略);
长上下文专用:Anthropic Claude的“Constitutional AI”分块机制、Google Gemini的“上下文缓存+分块融合”技术。
相关阅读