爲何要對新冠肺炎特效藥開展隨機雙盲對照實驗

原標題：爲何要對新冠肺炎特效藥開展隨機雙盲對照實驗

面對新冠肺炎疫情，人們迫切希望特效藥儘快出現。以致一旦有關於某些藥物療效的消息就會不脛而走，而這些消息本身卻真假莫辨。其實，確認某種藥物確實有效且副作用可控，可不是一件簡單的事情。

隨機雙盲對照實驗，被公認爲是評估諸如藥物療效等處理效應的黃金標準。根據相關媒體報道，目前已有幾例新冠肺炎備選藥物正在開展這一類型的實驗。最終這些藥物是否靠譜，必須要等待實驗的結果。

爲幫助讀者更好理解這類實驗的關鍵點、優勢和可能存在的問題，本文以案例形式，對其基本原理進行一個直覺性介紹。我們設想，研究者爲確認某種藥物的療效，安排一組患者（構成處理組）服用某種藥物，並觀察他們在服藥後的病情變化。假設研究者欣喜地發現，處理組在服藥後從整體上看病情有所好轉。那麼現在的問題是，這是否說明該藥物有顯著療效呢？

答案是否定的，因爲病情的好轉可能歸因於人體驚人的自愈效應而非藥物的療效。沒錯，評估藥物療效和評估一項政策的效應一樣，必須建立在因果識別的基礎上，而隨機雙盲對照實驗就是這樣一個因果識別框架。

本文首先通過介紹隨機雙盲對照實驗中“對照”、“雙盲”與“隨機”這三大關鍵詞的內涵，來釐清實驗設計的關鍵點。隨後，我們引入先佔效應（Preemption effect）這個重要概念，以揭示此類實驗可能會失效的情況。最後，我們提煉出兩點啓示，提醒研究者須客觀謹慎地檢視自己的研究成果，並始終牢記理論機制分析對實證研究的指導意義。

一，對照與雙盲

在因果識別框架中，爲控制自愈效應的影響，研究者有必要在安排處理組服藥的同時，再安排另一組患者（構成對照組）不服藥。通過比較處理組與對照組的病情變化差異，就能控制自愈效應。但問題依然存在，因爲與對照組相比，處理組或許受益於所謂的“安慰劑效應”（Placebo effect）——只要服藥者認爲自己得到了治療，即使其服用的是毫無藥效的糖丸，心理安慰作用也可能使其病情出現好轉。

那麼，如何進一步對安慰劑效應加以控制呢？研究者會安排所有患者都服藥，只不過處理組服用的是真藥，而對照組服用的是安慰劑——某種無藥效的糖丸。非常關鍵的是，所有患者對服用藥物的類型應該一無所知，亦即是“盲目”的。然而，要保證患者的“盲目”並不容易。實踐中很可能存在如下情況：

實驗工作人員在給患者分發藥物時，若他知道是在給處理組分發真藥物，則可能無意中會表現得比較嚴肅；若他知道是在給對照組分發安慰劑，則可能無意中會表現得比較隨意。此時，敏感的患者可能根據實驗工作人員表情中透露出的蛛絲馬跡，猜測其所服用藥物的類型，進而使得實驗結果摻雜了患者心理作用的影響。

上述例子表明，爲了保證患者是“盲目”的，研究者還有必要讓實驗工作人員與患者一樣“盲目”——實驗工作人員既不知道某位患者究竟屬於對照組誰還是屬於實驗組，也不知道其分發的藥物是真藥還是安慰劑。同時，這也有利於保證工作人員不會戴着“有色眼鏡”觀察患者病情變化，能客觀準確地記錄實驗數據。

在科學文獻中，確保被試與實驗工作人員“雙盲（Double-blind）”的實驗設計分別稱爲被試偏差（Subject bias）控制與研究者偏差（Researcher bias）控制。那麼，在被試偏差與研究者偏差均得到有效控制基礎上，處理組與對照組的病情發展差異是否就可以歸因於藥物的療效呢？

令人失望的是，答案依然是否定的，亦即控制上述兩種偏差仍然不夠。例如，萬一選擇進入處理組的患者都是一些身體狀況較差（較好）的患者呢？假如情況確實如此，則會導致實驗結果摻雜了所謂的樣本選擇偏差，以致藥物療效被低估（高估）。

二、隨機分配與抽樣誤差

爲了控制樣本選擇偏差，研究者會將患者隨機地分配到處理組與對照組。隨機分配（Random assignment）旨在保證處理前的等同性（Pre-treatment equivalence）。不過需要指出的是，這種等同性並不意味着處理組與對照組在身體狀況等方面從整體上看不存在任何差異，而是意味着，若存在差異，則這種差異是偶然而非系統性的，屬於所謂的抽樣誤差（Sampling error）。

隨機分配無法避免抽樣誤差，但我們希望抽樣誤差越小越好。爲此，研究者可以做兩件事情：

（1）進行大樣本實驗——基本的概率原理告訴我們，樣本容量越大，偶然性對實驗結果的影響越小。

（2）對處理組與對照組的病情發展差異進行統計學檢驗，以定量考察這種差異在多大程度上歸因於藥物療效而非抽樣誤差。

三，先佔效應與實驗的失效

現在我們要強調的是，雖然被公認爲是評估藥物療效的黃金標準，但隨機雙盲對照實驗並非無可挑剔，也存在失效的情況。一個經典的例子是，古人曾經用砒霜來治療性病，而若要對其療效進行隨機雙盲對照實驗，則實驗多半會失效。

原來，研究者按照上文提到的實驗步驟最終很可能發現，處理組與對照組均出現了大量死亡現象。但這是否就意味着砒霜對性病缺乏療效呢？並非如此，因爲即使處理組與對照組均出現大量死亡現象，其死因也並不相同——對照組主要死於性病，而處理組應該主要死於砒霜中毒。這表明，即使砒霜對性病存在療效，但其會被砒霜的毒性所掩蓋。在科學文獻中，這被稱爲先佔效應——一個原因在實驗前就制約了實驗中被操縱原因的影響，以致實驗無法顯示被操縱原因的實際效應。

當然，砒霜這個例子在今天不會發生，因爲現代人已經瞭解砒霜對人體的毒性。現實中更常見的情況是，研究者對某種先佔效應事先並不知情，結果使得單純的隨機雙盲對照實驗無法應對先佔效應的挑戰。顯然，要應對先佔效應對實驗的挑戰，研究者必須開展藥物對人體影響的理論研究——不僅包括藥物對疾病具有效果的因果機制研究，還包括其他副作用的理論研究。

在上述砒霜對性病療效的實驗中，存在兩種因果機制假設：

其一是，砒霜會讓患者中毒；

其二是，砒霜對性病產生療效。

當我們試圖對第二種因果機制進行實驗檢驗時，第一種機制就會產生先佔效應。在這個例子中，我們或許很容易從實驗結果中察覺到這一先佔效應，畢竟砒霜的毒性非常致命。然而在很多科學研究中，某種潛在的因果機制可能並不會像砒霜毒性這樣主導實驗的結果，但無疑仍會成爲一種混雜因素，導致我們對某一特定因果機制的識別產生偏差。

先佔效應及其相關討論提醒我們兩點：

第一，要以批判的眼光看待任何研究結果，即使它們滿足科學的程序而看上去顯得非常可靠；

第二，爲了提高因果識別的效度，應將實驗設計與理論機制分析緊密結合，充分發揮理論機制分析對構建因果識別框架的指導意義。

（作者姚耀軍爲浙江工商大學金融學院教授，楊奇明爲浙江理工大學經管學院教師）