DeepSeek 私有化部署中如何实现模型推理的动态扩缩容? 热门官方
回答:基于 Prometheus + HPA(Horizontal Pod Autoscaler)根据 QPS/GPU 利用率自动增减推理 Pod 副本数。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读