情感计算模型的鲁棒性测试:对抗样本的生成与评估基准? 热门官方
回答:鲁棒性测试需生成多样化对抗样本,评估模型在极端条件下的性能:①对抗样本生成:白盒攻击(如FGSM、PGD,已知模型参数)生成像素级扰动,黑盒攻击(如Boundary Attack,仅通过输入输出查询)生成自然扰动(如光照变化、旋转),跨模态对抗样本(如在语音中注入情感相反的文本特征);②评估基准:使用标准对抗测试集(如CIFAR-10-Adv用于情感化图像识别,IEMOCAP-Adv用于语音情感识别),指标包括对抗准确率(模型在对抗样本上的准确率)、鲁棒性-准确性权衡曲线(ROC曲线);③评估流程:在训练集上训练模型,在测试集和对抗测试集上分别评估,计算对抗准确率下降幅度(如从80%降至50%,下降30%)。当前基准测试中,最鲁棒的模型(如对抗训练的ViT)对抗准确率较基线模型提升40%。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读