来源:神经现实

饿了吃饭,渴了喝水是最简单不过的日常选择,我们每时每刻都在根据自身需求和周围环境调整自己的决定。所以何为奖赏?简单而言就是投你所好。基于自身的内在状态和对稳态的需求,奖赏会引起你的愉悦感。我们经常会用奖惩实验对小鼠进行训练,将测试所得结果作为他们的记忆指标,但时至今日,我们也并不清楚,我们的生理状态到底是如何帮助我们做决定,他们之间的神经环路基础又是什么?

近日,来自约翰·霍普金斯大学的科学家们证明了腹侧苍白球(ventral pallidum,VP)神经元会引导基于生理状态改变而变化的奖赏性选择。首先,为对小鼠不断变化的喜好建模,研究者们设计给口渴的老鼠两个选择:55μl糖水或者110μl纯水。他们设计了两种训练模式,第一种称为“特殊信号训练”,是给小鼠不同的声音提示并强迫他们进行相应的选择,例如听到鸟叫,小鼠做出反应踩下踏板,只有踩下55μl糖水的那个会在2s之后给出奖励,如果踩了110μl纯水的踏板则不给任何回报,反之亦然,并在每次训练结束后,都会给小鼠自由选择的时间,衡量在整个训练过程中小鼠对糖水或水的偏好。第二种训练则是“结果不确定训练”,小鼠在听到同种声音提示后被要求直接去奖励口,但是奖励的东西则是随机的,50%可能是纯水,50%可能是糖水。他们发现不论是哪种训练方式,随着训练过程的推移,一开始对纯水偏爱的口渴的老鼠慢慢转移到更喜欢糖水。他们认为在这期间,小鼠从渴到满足的状态变化是促使他们偏好发生改变的原因。

接下来,他们想知道有哪些脑区神经元参与其中。他们记录了小鼠在任务中VP的单个神经元活性,发现在特殊信号训练中,提示音会引起35%的神经元激活,在奖励阶段则有22%的神经元活动;相反,在结果不确定训练中,只有4%神经元对提示音产生应答,而奖励则带来71%的神经元活动。同时,他们注意到这些神经元一开始对纯水的提示音反应非常强烈,但随着生理状态的改变,神经元活性,慢慢减弱甚至抑制,对糖水的反应则是一直非常稳定。所以,某种提示所激发的神经元活性不仅取决于生理状态,也与这个提示带来的奖励有关,而这些神经元的变化能够精准地预测反映小鼠喜好行为的变化。


最后,研究者们进一步确认了VP神经元的重要性,他们对处于奖励阶段的小鼠脑内的VP的神经元进行光遗传刺激,发现这样可以人为的逆转小鼠此时的偏好选择。通过这个研究,科学家们证明了基于生理状态改变而做出不同偏好选择的时候,VP神经元可是你的指明灯。VP告诉大家:生理需求得到满足的同时,爱,也在慢慢消失。

相关文章