贴瓦片如何提升大模型的长程依赖建模? 热门官方
回答:通过跨Tile注意力或特征传递机制(如Memory Bank)弥补块间信息割裂,实现近似全局依赖。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读