情感大模型的“情感指令遵循度”评估指标体系? 热门官方
回答:需从三方面评估:① 准确性:生成情感与指令的一致性(如指令“生成温暖的话”,情感为“温暖”的样本占比);② 完整性:是否覆盖指令的所有情感要素(如指令“温暖+包含回忆”,需同时体现两者);③ 自然度:生成内容的流畅性与拟人化程度(如避免“温暖的情感,温暖的话”的重复)。指标包括:情感一致性得分(ACS)、要素覆盖度(ECD)、自然度评分(NPS),三者加权平均为总遵循度(如ACS×0.4+ECD×0.3+NPS×0.3)。实验显示,GPT-4的情感指令遵循度达88%,较GPT-3.5提升20%。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读