DeepSeek 私有化部署中模型服务的模型分片推理适用场景? 热门官方
回答:超大模型(如 175B)无法单卡加载时,可将模型按层或张量切分到多卡,适用于研究或特殊高性能需求场景。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读