情感建模中的数据标注技术与质量控制? 热门官方
回答:数据标注是情感模型训练的基础,核心技术:①标注规范定义(明确情感类别定义(如“喜悦”的面部特征为“嘴角上扬>15°+眼周肌肉收缩”)、强度分级(如0-1连续值)、多模态一致性规则(如“文本‘喜悦’需与面部表情‘微笑’一致”));②标注工具开发(如ELAN(多模态同步标注)、Labelbox(支持情感强度连续标注)、Doccano(文本情感标注));③标注人员培训(对心理学知识、标注规范的考核,合格后方可标注,标注一致性需>90%(Krippendorff's α系数));④质量控制方法:随机抽样复标(复标一致率<85%的样本需重新标注)、主动学习(模型挑选不确定样本让标注人员重点标注,提升标注效率30%)、众包标注+专家校验(众包标注低成本,专家校验保证质量)。关键技术挑战是主观情感标注的差异性(不同标注者对“轻微喜悦”的判断可能不同)。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读