來源:中國科訊

我是荷蘭隊球迷,但只是大賽型觀衆(所以近幾年來節省了不少時間),因此當我在1996年英國歐洲盃上第一次看見約爾迪·克魯伊夫上場時,頓時激動起來:“這是約翰·克魯伊夫的兒子啊!一定又是一個天才!哪怕只有他爸一半的基因,也能拯救荷蘭隊了!”

但幾場比賽踢下來,我很快就對他失望了。他的資質平平,在隊中作用一般,荷蘭隊狀態也不佳,先是悶平蘇格蘭,然後他和Bergkamp各進一球,2:0勝了瑞士,但隨後1:4大敗於東道主英格蘭,僥倖小組出線後就點球輸給法國而捲鋪蓋回家了。2年後的1998法國世界盃上,他連國家隊都沒進。

當然,我也不會太怪約爾迪。畢竟,其他球王級人物的子女在球場上的表現更差勁:

貝利的兒子Edinho是一個守門員,職業最高成就是隨桑托斯隊獲得1995年巴西聯賽亞軍。

馬拉多納的兒子Sinagra只踢到意大利丁級聯賽,後來改踢沙灘足球了。

貝肯鮑爾的兒子Stephan只打過幾場德國甲級聯賽,絕大部分職業生涯都在低級別聯賽裏度過。

所以,相比起來,小克魯伊夫已經算很成功了,入選過國家隊,踢過大賽,大部分職業生涯都在頂級聯賽,還效力的是巴塞羅那、曼聯這種強隊。畢竟,像羅納爾多、小羅、C·羅納爾多的那樣連續三代世界足球先生級別家族,是可遇而不可求的。

這其實就是我在“孩子比你成績差,才說明你這幾十年沒有白奮鬥啊”裏講的均值迴歸。首先,這些球王的孩子的足球天賦遠高於常人,要知道,哪怕是踢丁級聯賽,也是千挑萬選出來的。但其次,他們的成就遠低於他們的父親。

踢球如此,讀書也如此。從智商到身體素質、運動能力、考試能力、領導力等等,父輩的成就越高,他們孩子的成就也會比常人更高,但離他們父輩的成就也更遠。

達爾文的表弟高爾頓是第一個研究這個現象的科學家[1]。他測量了205對夫妻和他們的928個成年子女的身高,發現它們的分佈如下圖所示,其中橫座標是父母二人的身高的平均值,縱座標是每一個子女的身高(爲了方便比較,所有女性的身高都乘以了1.08),顏色深的點表示這裏的數據點更多: 

從這張圖可以看出:

第一,所有子女的平均身高和所有父母的平均身高差不多,大概是68英寸左右,即1.72米。

第二,平均來說,高個子父母的孩子也更高,矮個子父母的孩子也更矮。紅線是採用兩種不同計算方法的擬合結果,是持續正增長的。

第三,假如子女的高矮程度和父母一致的話,那應該擬合出來的是圖中的黑線,即斜率等於1,父母有多高,子女平均也有多高,父母有多矮,子女平均也有多矮。但真實情況擬合出來的紅線的斜率小於1,也就是說,子女的高或矮程度比父母的高或矮程度要更低。

高爾頓甚至計算出了這個係數(是的,他老人家就是線性迴歸方法的鼻祖),爲2/3[2]。比如說,中國男性的平均身高是1.70米,女性是1.58米[3],比值正好是1.08,那如果你們夫妻倆比較高,身高分別是1.86和1.70,則按照高爾頓的算法,你們的平均身高是(1.86+1.70*1.08)= 1.85,高出平均值1.70有0.15米之多。

但是,你們的孩子不會也高這麼多,他們只會高出0.15* 2/3 = 0.10,也就是兒子的期望身高爲1.80,女兒的期望身高爲1.80/1.08= 1.67。

當然,這是假設兩代人的身高不變的情況下,而且這個公式只是高爾頓從他的身高測量中總結出來的,未必在其他人羣中適用,更不見得適用於其他性狀,尤其他用線性關係來擬合也太簡單化了。但是,他觀察到的這個現象是準確的。人類乃至整個生物界都存在着這種均值迴歸現象。爲什麼呢?

因爲第一,身高這些連續分佈的性狀,都是很多基因控制的。人類當然也有一些性狀是少數幾個基因控制的,比如雀斑,主要受MC1R基因影響,還有眼睛顏色,主要受OCA2和HERC2基因影響。這些性狀的遺傳性都很高,父母如果有雀斑,孩子一定也有,父母都是黑眼珠(嚴格地說是深棕色),孩子一定也是黑眼珠。但這些性狀都不是連續的,你要麼有雀斑,要麼沒有,而眼睛的顏色一共也就是那麼多種,並不真的像彩虹一樣從紅色漸變到紫色,因爲少數幾個基因的組合總是有限的。

當一個表現出連續分佈的性狀,總是受多個基因影響的。那麼,從概率上講,大部分組合都會導致一箇中等的結果,只有少數罕見的組合才能出現極端的結果,並且大多涉及隱性基因。父母分別都是一種罕見結果,他們的基因重新組合後,還如此罕見的概率就沒有那麼大了。

舉個簡單粗暴的例子,假設有8個基因控制身高,用Aa, Bb, Cc, Dd, Ee, Ff, Gg, Hh來表示,其中大寫字母表示顯性等位基因,小寫字母表示隱性等位基因,隱性組合越多,個子越高。平均人羣的隱性組合爲4對。假如父親的基因是AABbccddeeffgghh,母親的基因是aabbccddeeffGgHH,兩個人都有6個基因爲隱性,因此個子都比較高,但是他們的孩子的基因經過重新組合後,只有1/4的可能仍然有6對隱性對爲基因(AabbccddeeffggHh),有1/2的可能有5對(AaBbccddeeffggHh或AabbccddeeffGgHh),有1/4的可能有4對(AaBbccddeeffGgHh),因此平均身高會低於父母。

第二,對於智力這種東西,它都不能被稱爲性狀,這不僅僅是因爲它受後天的影響很大(我們在這裏就暫時只討論它的先天成分),而且因爲智力的表現有很多種。最著名的比如加德納的多元智能理論,認爲人有語文、數理邏輯、空間、肢體動覺、音樂、人際、內省、自然等八大智能,因此我們說一對夫妻智力高的時候,他們很可能強的不是同一種智力,因此也不一定就能生出智力也高的孩子來。

所以,假如你是一個文科學霸,老公是一個理科學霸,那很可能導致你們成爲學霸的天賦因素是不同的,比如說,也許你擅長寫作但不那麼擅長推理,他擅長推理但不那麼擅長寫作。你們兩個的基因重新組合以後,很可能你們的孩子在寫作、推理兩方面都只比常人高一點,因此成績也就並不突出了。

甚至同一項能力,比如考試,我和我太太都比較強,但我們倆考得好的方法不一樣。我擅長抽象化,只要理解了背後的原理,就下筆如有神,但遇到無法理解的東西,比如語文中的閱讀理解或者作文主題,往往能離題萬里。我太太則喜歡具體化,就算是不理解的題目,她也能做出正確的答案。這兩種策略各有優劣,她能一直很穩定地考高分,而我的分數經常在極高和中等之間震盪。但最終,我們倆都在應試教育中取得了不錯的成績,因爲我們都有自己擅長的技能。可我們的孩子就慘了,很可能抽象化和具體化這兩項技能都無法get到,最終成績只能平平。

第三,就算你們夫妻倆是一模一樣的學霸,有一模一樣的考試技能,而且基因重新組合之後,孩子還同樣地複製了你們的學霸基因,也不能保證他的成績跟你們當年一樣好,因爲你們生長的環境不同了。

基因的表達受環境影響,你孩子在一個更富足、電子刺激更多、人際刺激更少的環境下長大,考試能力的發展很可能不一樣。漢高祖和呂后都是中國歷史上一等一的狠人,剛毅果決、心狠手辣,但生出來的惠帝,卻宅心仁厚、優柔寡斷。這裏固然有基因重新組合的問題,但惠帝五歲就被立爲太子,長於深宮之中、婦人之手,與高祖、呂后那種“混社會”的生活經歷相比,就算本來是猛虎,也被養成小貓了。

說到底,本來就沒有一個絕對的標準來衡量誰的基因更好,唯一能衡量的是你的基因和環境的契合程度。幾十年前讓你成功的基因,不見得在當下的環境裏,對你孩子成功的促進作用還有那麼大。因此,哪怕是你本人復生,再重新生長一遍,也不見得能取得當年的好成績。

理解這一切的關鍵就在於概率。對於一對普通夫妻,他們的基因重新組合之後,在不同的環境之下,孩子聰明的概率還是一個以平均值爲中間值的正態分佈。可是,對於一對聰明夫妻,他們的基因重新組合之後,孩子能仍然得到“聰明組合”的概率會降低,兩人的智力技能很可能會分散削弱,而且跟環境的契合度也會變小,導致了孩子雖然比其他孩子更聰明,但是比父母要笨一點——或者說,更正常一點。

而對於非常聰明的夫婦,你們倆越聰明,就說明你們的情況越罕見:你們各自都有一套很罕見的基因組合,發展出一套很罕見的智力技能,而且很幸運地和當時的環境相契合,得到了最佳的表現。因此,當你們倆的基因重新組合之後,這樣的“聰明組合”就越難複製,你們的智力技能就越難重合,而且與環境契合的概率就越低。因此,你們的孩子比一般聰明的夫妻的孩子更聰明,但是跟你們的差距也比一般聰明的家庭裏孩子跟父母的差距要更大。

就好象遺產稅。假如用高爾頓的公式,這個稅率就是1/3。假如你們倆的智商都是130,那麼你們跟100的平均值相比,有30的盈餘。對不起,你孩子沒法完全繼承這30的盈餘,他們得交1/3的遺產稅,最終可期望達到的智商只有120。

你的智商比普通人高得越多,交的遺產稅就越多。當然,哪怕交了遺產稅,你孩子的智商仍然高於常人。所以,你也不用太悲觀。假如你有10億遺產留給子女,雖然子女要交3.3億的遺產稅,喫的“虧”比只繼承1億遺產的要大,但繼承的絕對數字仍然是遠遠大於只給他1億遺產的。

這個遺產稅交到哪裏去了呢?給“笨”人了啊!假如一對夫妻的智商都是70,他們的孩子也不會只有70,而有80的平均值。

或者換用人口分佈就看得更加清楚了。用2016年的數據來估計[4],全國考生940萬人,985高校共招18萬7346人,你如果是985畢業,考試能力就是考生中的前2%。那一年清華北大共招7300人,所以如果你是清北畢業的,那就是考生中的前0.08%。再加上一本錄取率大概是略高於10%,就差不多正好構成了正態分佈的三個標準偏差的分界線:

如果我們假設考試能力也是同樣的正態分佈,那麼,如果你們倆都是清北畢業的,那麼你們比平均值高出三個標準差,可你們的孩子平均來說,只會高出兩個標準差,所以,平均來說,清北畢業的夫妻的孩子是上985(當然985也包括清北)。

如果你們倆都是985,那麼你們比平均值高出兩個標準差,可你們的孩子平均來說,只會高出1.3個標準差,所以,平均來說,985畢業的夫妻的孩子會上比較好的一本,大概是211(當然211也包括985)。

如果你們倆都是一本,那麼你們比平均值高出一個標準差,可你們的孩子平均來說,只會高出0.67個標準差,所以,平均來說,一本畢業的夫妻的孩子會上比較好的二本和稍微差一些的一本。

而且,如果考慮到很多同齡人根本沒有參加高考,那麼上面推算的實際的均值迴歸幅度還要更大一些。

那清北、985、211空出來的那麼多位置給誰?

——給普通人的子女啊。他們的基數比211大得多,佔到總人數的90%,雖然孩子能上好學校的概率遠低於清北的子女、較低於985的子女、稍低於211的子女,但在龐大的基數之下,仍然能夠在211中佔絕對多數,在985中佔相對多數,在清北里佔到一定比例。

類似的,更多的985子女會補充到清北里去,更多的211子女會補充到985裏去。

所以均值迴歸和進化並不矛盾。假如一個考試能力真的是強烈影響到生存和繁衍的話(我當然知道現實情況比這麼一句話複雜得多),那麼考得差的人留下的孩子更少,因此下一代的考試能力的平均值會變得更強,因此會有更多的人考得更好。雖然極少數清北、985、211的人的孩子考得更差了,但是從整體來看,下一代的考試能力變得更強了。

當然,其實智力和遺傳之間肯定不會是如此簡單的線性關係,因此在這裏用高爾頓的公式只是爲了方便說明問題,但實際情況可能和這個差別很大。不過均值迴歸的這個基本趨勢是不變的。哪怕由於大學擴招、出國留學的普及,下一代上好大學的幾率已經遠遠大於上一代,但聰明人的孩子平均來說沒有自己聰明這個規律,仍然成立。

這就是大自然的神奇之處。這個遺產稅不像人世間的財產遺產稅,富人們可以通過各種法律漏洞來逃避,在人類基因編輯技術真正可用之前,還沒有任何人可以逃脫。但這個遺產稅也比人世間的財產遺產稅靈活,它並不是一個死板的稅率————而是基於概率之上。

因此,均值迴歸只是說,如果你們倆都很聰明,那麼你們的孩子的平均智力期望值在你們之下,普通人之上。但是,他當然也有可能會與你們持平,甚至高過你們。就像居里夫人和先生,都是偉大的科學家,他們的女兒Irène後來也得了諾貝爾化學獎(但他們的另一個女兒Ève就壓根沒有從事科學)。又如楊武之先生是中國一流的數學家,但他的兒子楊振寧先生是世界一流的物理學家。

現在,如果你真的接受了均值迴歸的道理的話,那我猜要麼你的數學和邏輯思維能力很強,要麼你不止一個孩子。因爲兩個孩子之間,正如父母和子女之間一樣,也是共享50%的基因,所以,均值迴歸在兄弟姐妹之間也存在:假如有一個孩子在某一方面很強,那另一個孩子在這個方面也會比較強,但沒有那個孩子強。

比如,Irene得了諾貝爾化學獎,但Eve在科學上就毫無建樹。甚至在表兄弟之間,比如達爾文是超一流的科學家,高爾頓也是傑出的科學家,但成就就遜色一籌了。再如邁克爾·傑克遜,家裏的兄弟姐妹都是一流的歌手,但離他這個“流行之王”還差一個檔次。

所以,我常說,生老二是化解育兒焦慮的最佳方法。人類最常犯的錯誤之一,就是強行歸因,也就是把本來偶然性的事件,一定要找一個因果解釋。所以,地震是因爲天神發怒,輸球是因爲裁判偏心,而各種政治經濟現象都可以用一個陰謀論來解釋。

本來你當年學習好,是一系列基因、環境的組合,你卻一定要找出一個原因來,比如勤奮、搶跑,然後順着這個歸因,如果孩子成績不好,那麼要麼是他不夠勤奮,一面是自己的補課計劃不夠搶跑,於是逼着孩子整天上各種培訓班。但其實,就是你孩子的運氣沒有你好(大部分人的運氣都沒有你好)而已。

但如果你有兩個孩子,比如我家老二出生後,我驚訝地發現她與老大的差異竟然如此之大,兩人擅長的領域幾乎完全相反,這才真正地心悅誠服於基因和環境的偶然組合的概率論威力,徹底放棄了“孩子的能力應該等於父母的平均值”這麼幼稚的想法,然後就再不焦慮,更能順着孩子的自然天性來養育他們了。

相關文章