【數據技術】醫院如何提升床位資源配置效率?高級數據分析師這樣說

作者/張北(高級數據分析師)
文章來源/厚立醫視野
目前醫院在病床使用上存在較大提升空間 , 同一病區中有的醫療小組收納患者較多卻床位資源缺乏 , 有的醫療小組空床較多 , 造成病床資源浪費 。
【數據技術】醫院如何提升床位資源配置效率?高級數據分析師這樣說
文章圖片
圖源:厚立醫視野
上圖繪制了某醫院病區主診醫生接收患者的在院量趨勢 , 可以看到 , 患者在院量波動較大 , 即某些時間段病區病床閑置較多 , 某些時間段可能病床不足 。
如何有效提升病床使用效率呢?
病床的配置就是資源的分配 , 哪里不足分配哪里 。 然而每天患者的入出院是動態的 , 受多種因素影響(例如:季節、節假日) , 如何才能精確地配置病床?這里引入了強化學習算法 。
1
強化學習算法介紹
強化學習RL算法是一種模擬生活趨利避害行為的一種學習方式 , 能夠在無指導的情況下自主學習并能夠根據當前的環境實時地調整最優策略 , 在解決序列決策問題上有很大的優勢 。
智能體首先觀察環境獲得相應的狀態信息S , 然后根據策略函數選擇并執行當前狀態對應的動作A , 該動作會改變環境當前的狀態 , 并得到一個對動作好壞程度做出評價的獎賞R 。 智能體可以利用得到的獎賞對以后的行為進行優化 , 通過與環境不斷的交互學習可以逐步獲得最優策略 , 在整個過程中 , 智能體的目標是最大化累計獎賞 , 公式如下所示 。
【數據技術】醫院如何提升床位資源配置效率?高級數據分析師這樣說
文章圖片
圖源:厚立醫視野
說明白一點 , 強化學習的過程就是訓練智能體的過程 。 舉個例子——小孩做選擇題 , 這里可以把智能體看成小孩 , 做題的過程看做環境 , 選擇答案就是動作(A,B,C,D) , 小孩選擇錯了要受到老師打(懲罰) , 做對了老師就獎勵小孩 , 小孩為了獲得更多的獎勵 , 需要不斷地嘗試(試錯) , 經過大量地做題 , 小孩越來越聰明(每次都可以選擇正確) , 那么小孩就成功了(智能體訓練完成) 。
2
基于強化學習的病床資源優化
病床數量決定接納患者的數量 , 病床不足會造成患者無床可住 , 病床過剩又會導致資源浪費 , 因此病床的合理配置是關鍵 。 病床配置受多種因素影響 , 例如每天入出院患者量、節假日、病情、住院時長、醫生調崗等 , 需要在復雜的醫療環境中決策出合理的病床配置 。
簡單的資源優化算法很難實現資源合理配置 , 因此提出強化學習算法優化病區病床資源 。 強化學習通過復雜的狀態空間模擬真實的醫療場景 , 智能體依據當前狀態作出合理的病床分配動作 , 以最大化獎勵值實現病床的合理配置 。
【數據技術】醫院如何提升床位資源配置效率?高級數據分析師這樣說】1.模型創建及訓練
①創建環境
State=[n0,n1,n2,...,nm,b0,b1,b2,...,bm,i0,i1,i2,...,im,o0,o1,o2,...,om,e0,e1,...,em , L , S , W , H , F , h , d].
其中m表示醫療小組數量 , n表示在院數量 , b表示病床量 , i表示當日入院量 , o表示當日出院量 , e表示住院天數超標患者量 , L表示剩余病床 , S表示共享病床 , W表示星期 , H表示是否節假日 , F表示季節 , h表示調崗醫生 , d表示在崗天數 。
Action={...,-2,-1,0,1,2,...} , 智能體動作加床或者減床 。
Reward=A*新患者的費用-B*病床成本-C*沒住院的患者損失-D*超標出院損失 , 獎勵函數根據實際需求設置 。
②搭建模型:DQL模型
③模型訓練:根據數據量設置合適參數
④模型質控:接收率(acc)=每天住院數量/每天入院數量