
文章圖片
2、lncRNA表達或剪接位點使用曲線足以定義癌癥狀態
其他類型的轉錄組特征 , 包括lncRNA表達和RNA剪接 , 已被用作預后標志物或預測癌癥中的藥物應答 。 同時 , 少量位于lncRNA基因中的突變或破壞蛋白質編碼基因中的剪接已被證明會驅動癌癥發生 。 但是 , 目前尚不清楚lncRNA表達或RNA剪接的廣泛變化是否是癌癥發生的廣泛特征 。 作者嘗試使用這些轉錄組學特征來區分正常組織和腫瘤組織 。
3、深度學習網絡的解釋揭示了表征癌癥狀態的新轉錄組學特征
鑒于深度學習模型的高性能 , 作者想知道在我們的每個模型中 , 哪些轉錄組學特征是最重要的 , 以及這些特征是否主要由已知與癌癥遺傳相關的基因組成 。 為此 , 作者使用增強的積分梯度(EIG)生成了稱為腫瘤樣本歸因值的特征重要性評分 。
Ref:Enhancedintegratedgradients:improvinginterpretabilityofdeeplearningmodelsusingsplicingcodesasacasestudy.GenomeBiol.2020
選擇腫瘤類型中 , 具有較高歸因值的蛋白質編碼基因、lncRNA或剪接點 , 作為高歸因值集合;同時選擇歸因值接近于零的的特征作為參考的Neutral集合(Fig.2a) 。 在14種腫瘤中探究癌癥類型特異的歸因值時 , 作者發現歸因值前100的特征 , 在幾乎所有腫瘤樣本中都具有高的歸因值(Fig.2b) 。 這表明 , 深度學習模型不是由樣本量大的癌癥類型中的異常表達或剪接點使用驅動 , 而是依賴于癌癥的常見轉錄組學特征 。
先前的差異分析表明 , 所有腫瘤類型中沒有基因以相同的方式顯著失調 。 與差異表達分析一致 , 作者發現給定基因的歸因值的正負不一定反映癌癥中基因表達的變化情況 。 也就是說 , 具有正歸因值的基因不一定在大多數癌癥中表達上調 , 或 , 具有高負歸因值的基因不一定在大多數癌癥中表達下調 。 因此 , 該模型的解釋不是突出在許多癌癥類型中相似變化的基因或剪接改變 , 而是暴露出癌癥中始終偏離正常的轉錄組變異 。

文章圖片
4、表征癌癥狀態的轉錄組特征的遺傳改變頻率
接下來 , 作者想知道高歸因基因中以前未報告的遺傳改變是否可能推動模型強調的轉錄組變異 。 作者在TCGA樣本中證實了高歸因值基因幾乎不攜帶驅動突變(drivermutations)(Fig.3a) 。 但分析表明 , 具有高負歸因值的基因的樣本展現了更高的乘客突變頻率 , 相比于Neutral集合來說(Fig.3b) 。 同時 , 結構變異的頻率雖然在高歸因基因中高于其參考的Neutral集合 , 但在所有高歸因基因組中都低于COSMIC基因(Fig.3c) 。 同樣 , 高歸因基因受擴增或缺失事件影響的頻率與Neutral集合或COSMIC基因沒有顯著差異(Fig.3de) 。
總體而言 , 深度學習模型確定的癌癥轉錄組學特征并不經常受到遺傳改變的影響 , 這表明從模型中獲得的癌癥表達和剪接模式不是由這些基因的遺傳變異驅動的 。
5、定義腫瘤狀態的轉錄組學特征的高度進化和選擇性限制
在通過表達或剪接連接使用建立了具有高歸因值的基因列表 , 并發現這些基因中的大多數與COSMIC癌基因或抑癌基因不對應之后 , 作者試圖探究深度學習模型中具有高歸因值的轉錄組學特征 , 是否具有表明細胞中重要作用的特性 。
作者發現 , 和Neutral集合相比 , 模型中具有高歸因值的蛋白質編碼基因 , lncRNA基因和相對應的剪接連接的基因具有高度的進化保守性(Fig.4a) 。 同時 , 相對于參考的Neutral集合 , 具有高負歸因的蛋白質編碼基因以及正歸因值負歸因值的lncRNA顯著的更長 , 但高歸因值的剪接連接的基因顯著的更短(Fig.4b) 。 具有高歸因值的蛋白質編碼基因和剪接連接基因對功能喪失突變展現了更高的選擇性壓力(Fig.4c) 。 最后通過pyknons方法 , 發現高歸因值的lncRNA基因攜帶比Neutral集合更高的pyknons密度(Fig.4d) 。
- 常吃“豆腐乳”的人,最后會發生什么?看完文章后,你也許會明白
- 神農解痙方劑:這幾個表現是梅杰綜合征的“警示燈”!早看早知道!
- 儲藏新會陳皮必看,南北方要注意各自環境差異!
- 事關30億,確定不看看?
- 良醫|不明白?來,中山醫院“燕子醫生”畫給你看
- 鄉村振興看大連 | “科技”進村屯 鞏固脫貧成果
- 一天中,吃蘋果的3個“最佳時間”,想要悄悄變瘦的人,不妨一看
- “霸道總裁”劉愷威演過的電視劇,看過六部,你就是大神!
- 專家又出招:醫院不是菜市場,看病應預約,要我說專家挨罵真不冤
- 車前草|如何知道腎功能的強弱?從起床后的4個表現中可以看出
