Dopamine-modulated plasticity; bidirectional plasticity; basal ganglia; prediction error signal; actor-critic architecture; spiking neural network; temporal difference learning; D1/D2 receptors;
机译:扩展的基底神经节强化学习模型,以了解5-羟色胺和多巴胺在基于风险的决策,奖励预测和惩罚学习中的作用
机译:基底神经节的网络模型,用于了解多巴胺和5-羟色胺在基于奖惩风险的决策中的作用
机译:基底神经节的网络模型,用于了解多巴胺和5-羟色胺在基于奖惩风险的决策中的作用
机译:在基于Ganglia的尖端神经网络模型中学习延迟奖励缺乏惩罚,具有相反的D1 / D2可塑性
机译:短期突触可塑性在神经网络突增动力学和多重远距学习中的作用。
机译:扩展的基底神经节强化学习模型以了解5-羟色胺和多巴胺在基于风险的决策奖励预测和惩罚学习中的作用
机译:基于风险的决策,奖励预测和惩罚学习中基础神经节的扩展学习模型,以了解血清素和多巴胺的贡献