虚拟教师的情感支持策略如何通过强化学习优化? 热门官方
回答:虚拟教师需在“鼓励”与“施压”间动态平衡(如对自卑学生过度鼓励会降低挑战欲)。可将情感支持建模为马尔可夫决策过程(MDP):状态为学生当前情感状态(如“困惑+挫败”)与学习表现,动作为回应策略(如“分解任务+肯定进步”“指出错误+设定小目标”),奖励函数为学生的学习动机提升(如后续任务完成率)。通过PPO等强化学习算法训练,虚拟教师的情感干预有效性较规则引擎提升30%,且能适配不同学生的情感特质。
用户讨论(回复)
共 0 条记录,当前显示第 1- 条
« 上一页
下一页 »
相关阅读