原標題:斯金納箱:人類學習的祕密

作者:兔

來源:互聯網早讀課

轉自:人機與認知實驗室

如涉版權請聯繫編輯微信 @iwish89

哲學園鳴謝

斯金納同學(Burrhus Frederic Skinner,1904—1990,美國心理學家,新行爲主義學習理論的創始人)是一名很嚴肅的心理學家,他摒棄了傳統心理學中“心理活動”的不可考也不可靠的分析,將人的內部思維作爲黑盒函數,對心理學的外在刺激與外在行爲作爲自變量和函數結果,進行科學實驗分析,這就是“行爲心理學”。而“斯金納箱”,則是他的一項最著名的研究成果。

什麼是斯金納箱?

1. 行爲與獎勵

實驗1:將一隻很餓的小白鼠放入一個有按鈕的箱中,每次按下按鈕,則掉落食物。

結果:小白鼠自發學會了按按鈕。

這個實驗比“給狗狗搖鈴餵食”的巴普洛夫實驗更進了一步,建立行爲。

何爲學習?就是指將行爲與操作者的需求建立相倚性聯繫。換句話說,使行爲者感覺到“行爲”與“獎勵”是有聯繫的。

只要通過將行爲與獎勵不斷重複、建立聯繫,就可以培養起操作者的行爲模式。

獎勵可以培養行爲習慣,很棒吧?那麼看實驗2。

2. 行爲與懲罰

實驗2:將一隻小白鼠放入一個有按鈕的箱中。每次小白鼠不按下按鈕,則箱子通電。

結果:小白鼠學會了按按鈕。

但遺憾的是,一旦箱子不再通電,小白鼠按按鈕的行爲迅速消失。

“懲罰”,作爲獎勵的邪惡雙生子,可以迅速建立行爲模式。然而,懲罰具有一定的副作用:它建立起來的行爲模式,來得快,去得也快。一旦懲罰消失,則行爲模式也會迅速消失。

從長遠來看,懲罰對於行爲的制止並不會起到顯著作用。現實生活中,因爲懲罰帶來的凡勃倫效應,有時甚至會使懲罰起反作用。

凡勃倫效應:美國學者凡勃倫認爲,與產品越降價、需求越增多的一般規律不同,特定的產品越漲價,需求越增多。部分上流階層的消費目的在於,炫耀自己的社會地位和成功,滿足虛榮心,所以價格越高,需求則增加。相反,如果降價,體現上流階層的界限變得模糊,所以需求減少。

如果想要控制行爲者不去進行某個行爲時,應找到該錯誤行爲的“獎勵物”,移除該獎勵,從而制止其錯誤行爲。

然而,即使是獎勵,當不再掉落食物時,小白鼠的學習行爲也會逐漸消失(雖然消失得稍慢一些)。而且這樣太浪費食物了!那該怎麼辦呢?

接下來是實驗3。

3. 固定時間獎勵

實驗3:將一隻很餓的小白鼠放入斯金納箱中,由一開始的一直掉落食物,逐漸降低到每1分鐘後,按下按鈕可概率掉落食物。

結果:小白鼠一開始不停按鈕。過一段時間之後,小白鼠學會了間隔1分鐘按一次按鈕。

當掉落食物停止時,小白鼠的行爲消失。

嘖嘖,失敗了。沒有培養起小白鼠連續按按鈕的行爲,反而使小白鼠“偷懶”了。爲什麼?因爲行爲者知道短期內行爲不會再得到獎勵。……好吧。最關鍵的實驗4。

4. 概率型獎勵

實驗4:將一隻很餓的小白鼠放入斯金納箱中,多次按下按鈕,概率掉落食物。

結果:小白鼠學會了不停按鈕。

當不再掉落食物時,小白鼠的學習行爲消失速度非常慢。

隨着概率越來越低,小白鼠按按鈕的學習行爲沒有變化,直至40-60次按按鈕掉落一個食物,小白鼠仍然會不停按按鈕,持續很久一段時間。

(同樣的,用鴿子做實驗,平均每5分鐘獲得變化時距的食物強化的鴿子,每秒能做出2-3次反應,連續反應長達15小時)

這個實驗模擬了爲什麼“賭博”——如簡單的老虎機,或者更復雜的賭博——會給予人類以依賴感,或者說,成癮性。

由於概率性給予結果,行爲者很難直觀地判斷機制是否失效,所以單次的失敗不會給予明顯的“懲罰”效果,終止行爲者的習慣,從而行爲者的學習行爲會一直持續下去。

然後是一個有趣的實驗5。

5. 迷信的小白鼠?

實驗5:好吧,其實實驗5還是實驗4,概率型斯金納箱。

結果:這些小白鼠有很多培養出了奇特的行爲習慣,比如撞箱子、比如作揖、比如轉圈跳舞。

這是因爲掉落食物前,小白鼠正好在進行這些行爲,於是產生了“迷信”。

許多遊戲中傳出的謠言,比如“在中午抽獎容易得到大獎”,或者“帶滿一揹包幸運兔腳可以獲得更好的裝備”之類,其原理與之相同。

嗯。斯金納同學的虐鼠實驗介紹完畢。

斯金納箱模式的應用

1、用戶行爲培養鏈

設計者需要培養的用戶行爲可能多種多樣,但這些行爲尚未被用戶接受。如果想要培養出“付出代價”的習慣,就要將“代價”與“需求”之間建立聯繫。

比如,若遊戲玩家追求的是成就感,遊戲設計者希望玩家學會“消滅敵人”,那麼在“消滅敵人”的時候,必須提供“成就感”的需求,在多次重複的情況下,玩家就會對“消滅敵人”產生認識與學習。

一旦該行爲成爲了使用者已建立的行爲,那麼它也可以作爲“獎勵”去刺激其它行爲的培養。這樣,多次建立“付費”可以幫助“消滅敵人”的概念,而“消滅敵人”帶來“成就感”,遊戲對玩家付費行爲的培養就可以順利建立起來。

行爲培養需要注意的幾點:

(1) 人類的短期記憶數量爲7±2。不要試圖同時教給一個人過多的東西。

(2) 設計行爲的重複頻率時,別忘了艾賓浩斯遺忘曲線:5分鐘,30分鐘,12小時,1天,2天,4天,7天,15天。

2、遊戲設計

如果你在遊戲中見到了這些東西,那麼它們往往是斯金納箱:

(1)等級系統。

(2)任務系統。

(3)成就係統。

(4)檢查清單。

(5)獎勵反饋。

沒錯,幾乎包括了遊戲中所有東西,在現實生活中也可能會見到一些。它們都有一些固定的特點:1.行爲,2.強化刺激,3.不斷重複。

事實上,斯金納試圖用他的箱子解釋人類的一切學習行爲。而他似乎成功了。

3、遊戲化

現在的各種運營手段中,有一種叫做“遊戲化”的方式,指將一件本來枯燥的現實中的事情變成遊戲,比如……麥當勞的兒童套餐收集玩具?信用卡等級積分?老祖母的“如果你期末考前10名,我就帶你去遊樂場”?嗯嗯。沒錯。這些都是。

只要強化物得當,強化反覆出現,將一件用戶付出代價的行爲培養成爲用戶習慣並不困難。

P.S. 最後再介紹一個應用“斯金納箱”失敗的小故事。

實驗6:對於兩組畫畫的學生,其中A組在每完成一幅畫後給予獎勵,B組不給予獎勵。

結果:最後得到的結果是A組的作品數量遠高於B組,但質量略低於B組。

當停止給予獎勵後,A組學生的作品數量和質量均會低於B組。

爲什麼呢?請各位同學思考一下,在這個實驗中,實驗者期待的結果是什麼?A 組被強化的行爲到底是什麼?B 組的行爲有沒有得到強化呢?

相關文章