情感大模型的“情感幻觉”检测与 mitigation 技术? 热门官方
回答:情感幻觉指模型生成无依据的情感描述(如“用户听到‘项目通过’后感到‘绝望’”)。检测方法:① 情感 grounding 检查:验证生成情感是否有输入依据(如输入含“项目失败”才可能“绝望”);② 情感逻辑一致性:检查情感与常识的一致性(如“获得奖励”不应触发“愤怒”);③ 外部知识库验证:查询情感知识库(如ConceptNet)确认情感关联的合理性。Mitigation 方法:① 检索增强生成(RAG):生成时检索输入文本的相关情感证据,约束生成;② 后验过滤:用情感分类器过滤幻觉内容,重新生成。实验显示,RAG+后验过滤使情感幻觉发生率从18%降至2%。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读