周曉華:如何用數學語言來描述進行因果分析?( 三 )


周曉華:如何用數學語言來描述進行因果分析?
文章圖片
今年 , 周曉華團隊在《中國疾病預防控制中心周報》上的一篇文章回顧了用瑞德西韋治療COVID-19的兩個臨床試驗 , 這兩個試驗都涉及到死亡截斷問題 。 例如 , 當以病情恢復時間為結局 , 則在恢復前被死亡截斷的個體沒有結局定義 。 如果死亡率與基礎疾病存在正相關性 , 則把死亡個體當作在終點處刪失的做法低估了真實的治療效應 。 作者通過模擬實驗表明 , 把死亡當作刪失的方法以及存活案例分析方法(無論是否按協變量分層)都會導致有偏的治療效應估計[10] 。
4.中介分析
在一些問題中 , 干預和結局之間可能存在中介 。 用T表示治療方案 , M表示中介 , Y表示結局 。 這時 , 從T到Y存在兩條路徑:一條是從T直接到Y , 稱為直接因果作用;另一條是從T經過M再到Y , 稱為間接因果作用 。
例如 , 在關于大學生酗酒的研究中 , 受試者被隨機分配到三種方案T之一:放松(對照)、酒精掃描+干預、酒精掃描+干預+情緒控制技術 , 中介M是情緒控制能力 , 結局Y是3個月后的抑郁得分 。 經典的中介分析方法需要很強的序列可忽略性假設 , 要求中介和結局之間不能存在混雜 。 周曉華和合作者放寬了序列可忽略性假設 , 提出的新方法允許中介和結局之間存在混雜 , 并且允許存在缺失數據[11] 。
周曉華:如何用數學語言來描述進行因果分析?
文章圖片
今年周曉華團隊在StatisticsinMedicine發表的一篇文章關注了用確定結果隨機事件模型研究中介分析 , 對于二值變量的情形 , 在一些識別性條件下 , 作者給出了直接因果作用和間接因果作用的估計 , 允許序列可忽略性假設不成立 。 另外 , 當識別性條件被破壞時 , 作者給出了直接因果作用和間接因果作用的上下界[12] 。
5.個性化治療
個性化治療(或精準醫療)與因果推斷有著密切的關系 。 精準醫療旨在根據患者的特征 , 選擇恰當的治療方案 , 達到治療收益的最大化 。 但是 , 同一位患者一次只能接受一種治療 , 我們無法同時觀察到患者接受不同治療的結果 。 用因果推斷的語言說 , 設X表示患者的協變量 , Z為治療方案 , 可以取Z=0或1 , 用Y(z)表示患者接受治療z后的潛在結果 。 精準醫療卻需要根據協變量特異因果作用E[Y(1)-Y(0)|X]選擇相應的治療方案 。 具體而言 , 假設潛在結果數值越大表示患者收益越大 , 那么如果上面的協變量特異因果作用大于0 , 就選擇Z=1 , 否則選擇Z=0 。 這樣 , 我們可以從理論上把精準醫療轉化為因果推斷問題 。
給定潛在結果的單指標模型 , 在一些假設下就可以識別出協變量特異因果作用 。 比如 , 當我們比較中藥和西藥的療效時 , 可能會發現當生物標志物在一定范圍內(c1<X<c2)時 , 中藥治療比西藥治療更有效 , 否則西藥治療更有效 。 這樣 , 我們能畫出一條曲線 , 用于描述中藥相對于西藥的因果作用隨生物標志物變化的情形 , 即協變量特異因果作用曲線 , 這條曲線在臨床應用中為研究者提供了很大便利[13] 。
在最優個性化治療規則的因果作用估計方面 , 周曉華和他的同事首次提出使用生物標志物調整效應曲線(BATE)、協變量特征的治療效果曲線(CSTE)來表示給定生物標志物水平下的條件平均處理效應 , 并為每個病人選擇最優治療方案 , 同時嚴格證明了新提出統計方法的數學性質 。 針對治療結果為二分類變量時 , 周曉華和他的同事提出采用B樣條方法估計CSTE曲線 , 采用Hotellingtube方法估計CSTE曲線置信帶的新統計方法及理論 , 定義并推導出二值響應變量數據的CSTE曲線可表示為優勢比的對數 , 同時利用B樣條方法估計廣義變系數模型的系數 , 并推導出該方法的大樣本數學性質[14,15] 。