單細胞數據庫TEDD,助力人類疾病和發育生物學遺傳研究

作者:華大時空
近日 , 香港中文大學蔡光偉教授及董梓瑞博士團隊和深圳華大生命科學研究院談聰博士團隊在NucleicAcidsResearch雜志上發表題為《TEDD:adatabaseoftemporalgeneexpressionpatternsduringmultipledevelopmentalperiodsinhumanandmodelorganisms》的論文 , 發布了一個人和模式動物組織器官發育單細胞轉錄組與染色質可及性數據庫TEDD(TemporalExpressionduringDevelopmentDatabase) 。
單細胞數據庫TEDD,助力人類疾病和發育生物學遺傳研究
文章圖片
NucleicAcidsResearch官網截圖
TEDD系統地整合了現階段最新、最全的單細胞組學數據資源:來自人與多種模式動物(小鼠、斑馬魚、線蟲等)的2760個樣本的RNA測序數據 , 以及510萬個單細胞測序數據(單細胞RNA-seq和單細胞ATAC-seq) 。 同時 , TEDD提供用戶友好的交互式分析工具 , 供研究人員分析和可視化跨組織及不同發育期的基因表達、調控和網絡 。 研究人員通過TEDD , 不僅能夠識別細胞類型、組織類型的特定和時間性的基因表達及染色質譜 , 還可將發育和疾病中未確定生物功能的基因聯系起來 。
單細胞數據庫TEDD,助力人類疾病和發育生物學遺傳研究
文章圖片
解決數據挖掘和再分析難題
細胞命運決定(cellfatedecision)在多細胞生物從合子到功能分化的細胞類型、組織和器官的發育過程中起著非常重要的作用 。 人和其它哺乳動物的每個發育階段都涉及復雜的增殖、分化和重編程等細胞分化過程 。 近年來 , 單細胞和時空多組學技術的快速發展 , 使得深入理解模式動物及人組織器官的發育過程中細胞分化與基因動態調控成為可能 。 隨著單細胞測序研究數量的急劇增加 , 盡管已開發多種單細胞組學數據庫(如HCA、MCA、CDCP等) , 但目前仍缺乏一個參考數據庫 , 覆蓋模式動物和人生命發育周期最新和最全的數據集 , 以應對數據挖掘和再分析面臨的挑戰 。 基于此 , 香港中文大學和深圳華大生命科學研究院合作開發了TEDD 。
多功能上線助力人類疾病和發育生物學遺傳研究
TEDD目前已上線覆蓋多研究場景的功能 , 用戶通過TEDD導航欄子菜單引導即可進入相應頁面 。
單細胞數據庫TEDD,助力人類疾病和發育生物學遺傳研究
文章圖片
TEDD主要功能
NO.1以UMAP展示基因表達與染色質可及性
為了更好地展示數據 , 在輸入參數(物種、組織類型和查詢基因等)后 , TEDD按照細胞類型、組織類型、時間點以及性別4種不同要素標記UMAP中的細胞 , 用戶亦可手動去除某一或某些標記(如細胞類型)僅保留其感興趣的部分 , 基因表達或染色質可及性以熱圖形式展示 。 為了便于比較 , TEDD還可在同一界面展示兩個查詢結果 。
NO.2共表達分析
在以往研究中科研人員較難確認具有多基因共同表達的細胞類型與表達比例 。 TEDD解決了這一難題 , 其提供了細胞類型、時間點以及性別3種不同要素下 , 共表達多個目標基因的細胞類型以及比例 , 供研究者挑選下一步實驗的對象 。
單細胞數據庫TEDD,助力人類疾病和發育生物學遺傳研究】NO.3多基因表達趨勢聚類分析
在選擇參數(物種、組織類型、細胞類型和時間點等)后 , TEDD提供多基因列表進行表達聚類 , 用戶也可查詢目標基因所在的GO和KEGG通路獲取該通路所包含的基因列表進行表達聚類 。
NO.4時序性特異表達基因查找
TEDD提供同一組織類型、不同時間節點中存在顯著差異表達的基因;也可選擇不同組織類型、細胞類型和時間節點后 , 在自定義差異倍數變化及最大輸出基因個數的情況下 , 查找與已檢測到差異表達基因存在相同或不同表達趨勢的基因列表 , 供研究人員進一步探索不同基因之間的調控關系 。 此外 , TEDD提供時序性穩定表達基因查找功能 。