DeepSeek 私有化部署中如何实现模型服务的按业务优先级分配 GPU? 热门官方
回答:在调度器中为不同业务的 Pod 设置 priorityClass,高优先级 Pod 在资源紧张时优先获得 GPU 配额。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读