周曉華：如何用數學語言來描述進行因果分析？( 二 )

2026-05-09

(2)單調性假設，即Di(1)≥Di(0) ，不存在d組；
(3)a組和d組的排他性約束假設，即a組和d組的兩種潛在結果相等。
下面我們用一個實際例子來說明帶非依從性的因果推斷[1] 。為了研究流感疫苗的作用，實施一個激勵試驗。這里，分配的方案是鼓勵打疫苗、不鼓勵打疫苗，但被鼓勵打疫苗的人仍有可能不打疫苗，未被鼓勵打疫苗的人也有可能打疫苗。傳統的意向治療分析是有問題的，因為這種做法得到的是鼓勵打疫苗的作用，而不是實際打疫苗的作用。用工具變量把人群分層后，估計依從組的因果作用，才能代表打疫苗的真實作用。
周曉華和他的同事解決了隨機臨床試驗中存在非依從性和不可忽略的結局缺失時研究參數的可識別性問題，提出了針對非依從性的貝葉斯分析方法，證明了在不同類型的完全不可忽略缺失數據下（即缺失機制依賴于結局），滿足一定條件時，感興趣的因果參數是可識別的，同時推導出了參數的最大似然估計和矩估計，并分析了它們在有限樣本中的性質。當結局存在不可忽略缺失時，或者對于聚類激勵試驗，研究了多重填補方法[2-5] 。
利用高維協變量和觀測數據，在不存在強可忽略性假設的情況下，周曉華和合作者提出了異質局部治療效應的新估計和推斷方法[6] 。針對兩階段廣義線性模型，給出了非凸目標函數下的Lasso估計，并提出了一種協變量特異治療效果置信區間的構造方法，這種方法同時糾正了由于兩個階段的高維估計而產生的偏差。這項研究成果即將發表在JRSSB上。
3.非標準條件下的因果推斷之死亡截斷
和非依從性類似，死亡截斷也會破壞經典的因果分析假設。在臨床試驗中，一些個體可能在收集到結局之前就發生死亡，這一現象被稱為死亡截斷。需要特別強調的是，死亡截斷與缺失數據是兩個完全不同的問題：前者的結局沒有定義，而后者的結局有定義、只不過是未被觀察到罷了。
用Zi表示第i個個體被隨機分配的處理方案（假設個體依從于分配方案）， Si(Zi)表示個體i的潛在存活狀態（1表示存活， 0表示死亡）， Yi(Zi)表示潛在結果（如果Si(Zi)=1），用Xi表示協變量。仍然利用主層分析的方法，把人群分為四層，用G表示：永遠存活組LL（Si(z)=1）、永遠死亡組DD（Si(z)=1）、有益組LD（Si(z)=z）、有害組DL（Si(z)=1-z）。只有永遠存活的LL組，其因果參數是有意義的，因為對于其他組來說，兩個潛在結果至少有一個是無定義的。因此，我們關心永遠存活組的平均因果作用SACE=E[Yi(1)-Yi(0)|G=LL] 。
類似地，為了識別存活組平均因果作用，需要做出額外的假設：關于S和Y的可忽略性假設、單調性假設、排他性約束假設、替代相關性假設。通過工具變量對人群分層，進而使用參數模型估計出存活組的因果作用[7,8] 。在單調性假設下，有害組DL組被排除了。如果要放寬單調性假設，可將其替換為隨機單調性假設，也就是允許DL組的存在，但需要事先給定Si(1)、Si(0)和LL組之間的概率關系。
周曉華和他的同事在國際上率先提出了用于超過三個組別且存在死亡截斷的多處理隨機臨床試驗的統計方法[9] 。此外，周曉華和他的同事還發展了新的推斷方法來檢驗總體治療效果，并且證明了該方法在大樣本下的收斂性，完善了大樣本下該方法的統計理論。周曉華和他的同事還提出了適用于結果是二分類和連續型變量的情形下，在非參數和半參數模型中識別感興趣因果參數SACE的方法。證明了SACE在部分正則假設下可識別的數學性質，同時提出當違背部分假設時，減少估計偏差的統計方法和理論。

上一篇：711里挖掘到的黑暗料理，我吃完竟然覺得“真香”？

下一篇：靈魂拷問！益生菌真的是智商稅嗎？