來源:神經現實

餓了喫飯,渴了喝水是最簡單不過的日常選擇,我們每時每刻都在根據自身需求和周圍環境調整自己的決定。所以何爲獎賞?簡單而言就是投你所好。基於自身的內在狀態和對穩態的需求,獎賞會引起你的愉悅感。我們經常會用獎懲實驗對小鼠進行訓練,將測試所得結果作爲他們的記憶指標,但時至今日,我們也並不清楚,我們的生理狀態到底是如何幫助我們做決定,他們之間的神經環路基礎又是什麼?

近日,來自約翰·霍普金斯大學的科學家們證明了腹側蒼白球(ventral pallidum,VP)神經元會引導基於生理狀態改變而變化的獎賞性選擇。首先,爲對小鼠不斷變化的喜好建模,研究者們設計給口渴的老鼠兩個選擇:55μl糖水或者110μl純水。他們設計了兩種訓練模式,第一種稱爲“特殊信號訓練”,是給小鼠不同的聲音提示並強迫他們進行相應的選擇,例如聽到鳥叫,小鼠做出反應踩下踏板,只有踩下55μl糖水的那個會在2s之後給出獎勵,如果踩了110μl純水的踏板則不給任何回報,反之亦然,並在每次訓練結束後,都會給小鼠自由選擇的時間,衡量在整個訓練過程中小鼠對糖水或水的偏好。第二種訓練則是“結果不確定訓練”,小鼠在聽到同種聲音提示後被要求直接去獎勵口,但是獎勵的東西則是隨機的,50%可能是純水,50%可能是糖水。他們發現不論是哪種訓練方式,隨着訓練過程的推移,一開始對純水偏愛的口渴的老鼠慢慢轉移到更喜歡糖水。他們認爲在這期間,小鼠從渴到滿足的狀態變化是促使他們偏好發生改變的原因。

接下來,他們想知道有哪些腦區神經元參與其中。他們記錄了小鼠在任務中VP的單個神經元活性,發現在特殊信號訓練中,提示音會引起35%的神經元激活,在獎勵階段則有22%的神經元活動;相反,在結果不確定訓練中,只有4%神經元對提示音產生應答,而獎勵則帶來71%的神經元活動。同時,他們注意到這些神經元一開始對純水的提示音反應非常強烈,但隨着生理狀態的改變,神經元活性,慢慢減弱甚至抑制,對糖水的反應則是一直非常穩定。所以,某種提示所激發的神經元活性不僅取決於生理狀態,也與這個提示帶來的獎勵有關,而這些神經元的變化能夠精準地預測反映小鼠喜好行爲的變化。


最後,研究者們進一步確認了VP神經元的重要性,他們對處於獎勵階段的小鼠腦內的VP的神經元進行光遺傳刺激,發現這樣可以人爲的逆轉小鼠此時的偏好選擇。通過這個研究,科學家們證明了基於生理狀態改變而做出不同偏好選擇的時候,VP神經元可是你的指明燈。VP告訴大家:生理需求得到滿足的同時,愛,也在慢慢消失。

相關文章