DeepSeek 私有化部署中如何实现请求优先级调度? 热门官方
回答:在消息队列或推理服务前增加优先级队列,高优先级请求优先进入计算,适用于混合业务场景(如 VIP 用户优先)。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读