AI大模型知识库如何通过跨模态检索增强视觉问答的精度? 热门官方
回答:将图像区域特征与文本描述映射到统一向量空间,检索时融合视觉相似度与语义匹配得分,推理阶段结合图像证据与文本知识生成答案,标注视觉来源区域提升视觉问答的可解释性与准确性。?
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读