DeepSeek 私有化部署中模型服务的推理服务动态资源伸缩触发条件如何设定? 热门官方
回答:综合 QPS、GPU 利用率、请求排队长度与平均延迟设置阈值,避免短时波动引起频繁扩缩容。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读