贴瓦片如何优化大模型的内存峰值? 热门官方
回答:流式读取Tile,处理完即释放;采用in-place融合减少额外缓冲;控制Batch内Tile数量。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读