 第一章 因果推論與實驗方法 因果關係是個既有趣卻又動輒引發爭議的問題,然而社會科學研究中所有涉及「由因推果」(effects of the cause)的效應評估(impact evaluation)型問題,都無法迴避因果推論。 在因果推論的方法上,「比較法」扮演舉足輕重的角色,但運用時卻需謹慎,除非拿來比較的各組原先在各方面都旗鼓相當,否則光憑組間之異同驟下論斷,往往容易誤導。無怪乎統計課本常告誡:相關未必有因果關係(association does not imply causation)。例如在評估政府某個職業訓練方案的成效時,若發現受過訓者的平均薪資,比起沒受過訓者還低,不宜驟下論斷認定該方案成效適得其反,因為很可能當初自己選擇(self-select)去受訓者本來就有工作能力上的困難,因此薪資較低也許只是反映原先能力上的差異,並非職訓造成反效果。換言之,逕行比較有受訓和沒受訓這二群人,太過於直觀,尚不足以斷定職訓方案的效果;唯有確保這二組人在職訓開始之前的工作能力等諸多因素的分布都相當(equivalent),之後受完訓者薪資仍較低,我們才能排除其他可能的干擾原因,推論係職訓方案本身成效不彰。 第一節 反事實因果模型 壹 導論 早在19 世紀,J. S. Mill(2012[1843])提出的「同中求異法」(method of difference,或譯為「差異法」)就清楚指出:如果比較的對象原先處處相同,唯有我們感興趣的「因」不同,此時「果」的差異就較能合理推斷是由這個「僅此一家,別無分號」的因所造成。 若把這個「同中求異法」的邏輯進一步推至極端,那麼最理想的因果推論方式,莫過於:在相同的時空下,同一個人的本尊與自己的分身相比,也就是「本尊—分身對比法」。我們可以想像同一時空內本尊與分身其他條件都相同,但唯有「因」不同,那麼本尊與分身在「果」的差異必來自這個「因」的獨門差異,因果推論就一清二楚、無可爭議了。 最早把這種思維用在實驗設計(experimental design)中的,是統計學家Splawa-Neyman(1990[1923])。他在討論完全隨機分派之農業實驗時,提出「潛在結果」(potential outcomes)的概念:同一塊地,在實驗之前有數種「潛在的產量」(potential yields),但實驗後實際觀察到的產量(observed yield)僅是數種潛在產量之一的實現,而後者與前者的差值,就代表實驗施測(因)產生的效應(果)。Rubin(1974; 1990a; 1990b; 1991; 2005)把這個觀念發揚光大,延伸到所有實驗與非實驗的因果推論,故常被稱為「Neyman-Rubin 因果模型」。 然而實際上, 同一個人在同一時空, 要不然有受到因的影響、要不然就是沒受到因的影響,無法「一人同時分飾兩角」來自己與自己相比,造成Holland(1986, 947)所謂之「因果推論的根本難題」(the fundamental problem of causal inference)。不過這個「自己(本尊)與另一個潛在的自己(分身)相比」的腦力激盪式想像實驗(thought experiment),卻正是近年盛行的「反事實因果模型」(counterfactual model of causality)的思維根源:實際發生並觀察到的是事實(fact),想像該同一個單位若在「因」的其他條件下可能(但觀察不到)的結果就是「反事實」(counter-fact)。要確認X是Y的因,除了建立X和Y聯袂發生的相關規律外,也必須逆向思考:那若X 沒有發生的話,Y會如何?故因果效應的推論,還要進一步比較「實際結果」(事實)和「潛在但未發生的結果」(反事實)兩者之差異。 說得白話一些,「反事實因果模型」並無高深莫測的玄奧之處,只是用比較亮麗的詞彙來重申:「由因推果」必涉及至少二種不同條件下的「因」相比較,而比較的對象又必須在一開始的立足點上相等才能比(comparable),也就是「因」之外的各項測前協變數(pre-treatment covariates)要越像越好,「與本尊像到不行」的極致,就是同一個人的本尊與自己的分身相比。但是在法律和道德均不允許複製人的情況下,社會科學做因果推論的最大挑戰,就是發揮創意和巧思,透過嚴謹的研究設計(research designs),為研究標的之本尊(事實),找相同時空下「與本尊像到不行的替身」(反事實)來比較。一旦為原本學理上觀察不到的反事實找到了可實證觀測的替身,因果推論就有所本,可以清楚識別(identify)因對果產生的效應了。 「反事實因果模型」的思維在社會科學的實證研究中掀起了一場革命,經濟學者Angrist 與Pischke(2010)回顧1990 年代以來計量經濟學在因果推論的信度上大幅改進,稱之為「可信度革命」(credibility revolution),並將此進展歸功於反事實模型激發出來的嚴謹研究設計,包含隨機分組實驗及準實驗設計(如工具變數、斷點迴歸、雙重差分等)。政治學自不例外於這場革命(Ashworth, Berry, and de Mesquita 2021; Druckman and Gr een 2021; 黃紀等 2007;黃紀 2008;2010;2013;2024),且其發展極為快速。 |