如何在贴瓦片推理中动态控制计算预算? 热门官方
回答:引入预算感知切块算法:根据剩余时间与显存预算动态缩减Tile数量或降低单Tile计算精度(如从FP32到INT8),并通过强化学习训练控制器优化预算分配策略,确保关键区域优先获得足够算力。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读