……
工欲善其事,必先利其器,看完這一篇推文,解答以上所有疑惑。
單細胞測序數據分析之1、細胞軌跡分析–揭示細胞發(fā)育分化動態(tài)軌跡
![圖1?利用Monocle推斷類風濕性關節(jié)炎PBMCs B細胞的分化軌跡[3]](http://www.szhpures.com/wp-content/uploads/2022/05/1-13.png)
圖1?利用Monocle推斷類風濕性關節(jié)炎PBMCs B細胞的分化軌跡[3]
2020年Nature Communication發(fā)表的Single-cell RNA-seq reveals that glioblastoma recapitulates a normal neurodevelopmental hierarchy[4],利用RNA速度表征了膠質母細胞瘤的分化過程,證實了膠質母細胞瘤層次結構頂點是腫瘤祖細胞,星形細胞、間充質、少突膠質細胞和神經元癌細胞比腫瘤祖細胞的分化程度更高,并且在每個患者中均可見特定細胞分化方向(圖2)。
![圖2?基于RNA?velocity分析膠質母細胞瘤細胞分化路徑[4]](http://www.szhpures.com/wp-content/uploads/2022/05/2-16.png)
圖2?基于RNA?velocity分析膠質母細胞瘤細胞分化路徑[4]
單細胞測序數據分析之2、細胞通訊分析–解析細胞間的信號通訊關系
多細胞生物是由很多不同類型細胞組成的開放而復雜體系,配體受體復合物介導的細胞間通訊對協(xié)調發(fā)育、分化和炎癥等多種生物學過程至關重要。細胞通訊分析,又稱細胞受體-配體互作分析,是以細胞亞群的基因表達量數據為研究對象,通過獲得細胞中配體及受體基因的表達信息,比較細胞類型之間的配體與受體基因表達差異,分析得到細胞亞群間的信號通訊關系,在闡明生物學過程中細胞間通訊的復雜性、多樣性和動態(tài)性方面有重要意義。
2020年Nature Communications發(fā)表的Single-cell RNA sequencing highlights the role of inflammatory cancer-associated fibroblasts in bladder urothelial carcinoma[5],對8例膀胱癌腫瘤樣本和3例配對癌旁粘膜樣本進行了單細胞轉錄組測序分析,利用CellphoneDB[6]軟件進行細胞通訊分析,分析結果發(fā)現,炎性癌癥相關成纖維細胞iCAFs與其他細胞類型的相互作用最多,且與內皮細胞ECs的相互作用最強(圖3a);iCAF表達更高水平的CXCL12,其受體包括 DPP4、CXCR3、CXCR4 和 ACKR3 (CXCR7),由于CXCR4和CXCR3 在免疫細胞上廣泛表達,猜測iCAFs分泌 CXCL12是膀胱癌免疫浸潤狀態(tài)的原因(圖3b);iCAFs產生VEGF(包括VEGFA和VEGFB),與ECs的VEGF受體(FLT1、KDR、MET和FLT4)結合,促進血管生成,與腫瘤的惡性進展有關(圖3c)。
![圖3?利用CellPhoneDB分析膀胱癌不同細胞類型間配體-受體相互作用[6]](http://www.szhpures.com/wp-content/uploads/2022/05/3-13.png)
圖3?利用CellPhoneDB分析膀胱癌不同細胞類型間配體-受體相互作用[6]
單細胞測序數據分析之3、GSEA/GSVA分析–基于功能基因集的富集分析策略
GSEA( Gene Set Enrichment Analysis),是2005年由Broad Institute研究開發(fā)的一種基于基因集的富集分析方法[7],用來評估一個預先定義的基因集的基因在與表型相關度排序的基因表中的分布趨勢,從而判斷其對表型的貢獻。GSEA是從所有基因的表達豐度出發(fā),分析在不同的通路中的基因的整體表達影響,這也是區(qū)別于GO/KEGG富集分析的地方,GSEA不需要設定差異閾值篩選目標基因集,理論上更容易囊括細微但協(xié)調性的變化對生物通路的影響。
上述膀胱癌的單細胞文獻中[5],利用GSEA對iCAFs和肌癌相關成纖維細胞mCAF兩種細胞類型的基因進行了GSEA富集分析,結果顯示,iCAFs與胞外基質降解基因集顯著相關,暗示iCAFs可能在腫瘤轉移中發(fā)揮作用,同時iCAFs與細胞因子-細胞因子受體相互作用基因集也顯著相關(圖4,左圖);mCAFs則與肌肉收縮、PGC1A通路顯著相關,這一結果與之前的體外研究結果一致(圖5,右圖)。
![圖4?利用GSEA分析膀胱癌腫瘤相關成纖維細胞顯著富集的通路[5]](http://www.szhpures.com/wp-content/uploads/2022/05/4-13.png)
圖4?利用GSEA分析膀胱癌腫瘤相關成纖維細胞顯著富集的通路[5]
GSVA分析(Gene Set Variation Analysis)[8]與GSEA(Gene Set Enrichment Analysis)都是一種基于基因集的富集分析方法,能夠有效彌補傳統(tǒng)富集分析對微效基因的有效信息挖據不足等問題,更為全面地對某一功能單位的調節(jié)作用進行解釋,Broad研究所在GSEA發(fā)布8年之后,開發(fā)了GSVA算法來拓展基因集分析的應用。GSEA分析主要用于兩兩組間比較的方案設計中,對于分組比較復雜的方案設計則比較適合GSVA分析,GSVA不需要預先進行樣本之間的差異分析,依據表達矩陣就可以計算每個樣本中特定基因集的變異分數。
2020年Cell Research發(fā)表的Single-cell transcriptomics reveals regulators underlying immune cell diversity and immune subtypes associated with prognosis in nasopharyngeal carcinoma[9],利用GSVA分析了鼻咽癌NPC不同細胞亞型間的通路活性差異,結果顯示,參與干擾素 (IFN)-α和IFN-γ通路在巨噬細胞中相對上調,而血管生成、NF-κB 介導的 TNF-α 信號傳導和缺氧相關信號通路在單核細胞中上調(圖5,左圖);生發(fā)中心(GC)B細胞表現出丙酮酸代謝和MYC途徑的激活,而漿細胞中的糖酵解途徑被上調,在漿細胞中也檢測到巨噬細胞趨化途徑的高活性,表明這些途徑在促進巨噬細胞募集到 NPC 中的 TME 中的潛在作用(圖5,右圖)。
![圖5?利用GSVA分析鼻咽癌不同髓系細胞亞型間的通路活性差異[9]](http://www.szhpures.com/wp-content/uploads/2022/05/5-11.png)
圖5?利用GSVA分析鼻咽癌不同髓系細胞亞型間的通路活性差異[9]
單細胞測序數據分析之4、腫瘤拷貝數變異分析–揭示惡性細胞表型
拷貝數變異(Copy number variation, CNV)是由基因組發(fā)生重排而導致的,基因組大片段的拷貝數增加或者減少,基因組結構變異(Structural variation, SV) 的重要組成部分,也是人類疾病的重要致病因素之一。與正常細胞相比,腫瘤基因組部分區(qū)域呈現過表達或低表達狀態(tài),通過與一組參考的“正?!奔毎啾?,比較不同樣本間或不同細胞類型之間的CNV基因表達差異,探索腫瘤基因組位置上基因的表達強度,最終反映基因大片段區(qū)域的CNV事件,鑒定體細胞整個染色體或大片段染色體的擴增或缺失。
2021年Cell death discovery發(fā)表的Single-cell RNA transcriptome reveals the intra-tumoral heterogeneity and regulators underlying tumor progression in metastatic pancreatic ductal adenocarcinoma[10],利用inferCNV[11]對胰腺導管腺癌轉移灶的5種導管細胞亞型進行inferCNV分析,鑒別惡性細胞,分析結果發(fā)現,五種導管細胞亞型都經歷了顯著的CNV事件,均為轉移灶中的惡性細胞(圖6E);計算CNV scores并繪制小提琴,發(fā)現1型導管細胞的CNV水平顯著高于其他類型的導管細胞,提示1型導管細胞惡性程度更高(圖6F)。
![圖6?利用inferCNV揭示胰腺導管腺癌惡性細胞類型[11]](http://www.szhpures.com/wp-content/uploads/2022/05/6-11.png)
圖6?利用inferCNV揭示胰腺導管腺癌惡性細胞類型[11]
單細胞測序數據分析之5、轉錄因子活性分析–挖掘關鍵調控轉錄因子
?單細胞研究通常會涉及到一個核心關鍵問題:細胞的異質性以及這種異質性是如何發(fā)展和維持的。這種細胞異質性很大程度上是由潛在的基因調控網絡決定的,特定轉錄因子(transcription factor,TF)集合的協(xié)同表達驅動各自靶標基因的表達,從而建立特定的基因表達譜。因此,單細胞的基因調控網絡對于深入挖掘細胞異質性背后的生物學意義是至關重要的。SCENIC Suite[12]是一套基于SCENIC(Single-Cell Regulatory Network Inference and Clustering)來研究和破譯基因調控的工具,能從單細胞轉錄組數據中推斷TF、基因調控網絡和細胞類型,基本原理是基于共表達和DNA調控保守序列(motif)分析推斷基因調控網絡,然后在每個細胞中分析網絡活性以鑒定細胞狀態(tài)。
上述鼻咽癌的單細胞文獻[9],利用SCENIC分析髓系細胞的轉錄因子活性,發(fā)現BNR1H3 和 TFEC 轉錄因子活性在巨噬細胞中顯著上調(圖7e);進一步利用生存分析揭示了NR1H3和TFEC的高表達水平與 NPC 患者預后改善之間的關聯(lián)(圖k, n),暗示NR1H3和TFEC在鼻咽癌發(fā)展中的重要調控作用。
![圖7??基于SCENIC分析鼻咽癌關鍵調控轉錄因子[9]](http://www.szhpures.com/wp-content/uploads/2022/05/7-7.png)
圖7??基于SCENIC分析鼻咽癌關鍵調控轉錄因子[9]
單細胞測序數據分析之6、加權基因共表達網絡分析–篩選表型相關核心調控網絡
加權基因共表達網絡分析(Weighted Gene Co-expression Network Analysis, WGCNA)[13]是構建基因共表達網絡的常用方法,可以探索模塊與特定表型或疾病的關聯(lián)關系,最終達到鑒定基因網絡的目的;單細胞測序技術可以揭示特定腫瘤組織中的細胞特異性,對細胞進行分類,并且識別特定的標志物,但其檢測的細胞數量和病例來源都是有限的。利用WGCNA分析單細胞轉錄組測序數據,可以提供一套有別于高変基因、差異分析的方法,不依賴于數據庫直接用表達量的相關性值預測調控關系,篩選某些細胞亞群中有關聯(lián)作用的基因集(稱為模塊),可以從成千上萬的基因中挑選出高度相關的基因的模塊,并將模塊與表型進行關聯(lián),尋找marker gene或治療靶點。
2021年Nature communications發(fā)表的Cellular and molecular landscape of mammalian sinoatrial node revealed by single-cell RNA sequencing[14],利用WGCNA分析成年小鼠竇房結SAN細胞基因表達網絡,確定了十個共表達模塊(圖8a);功能富集分析結果顯示有六個模板與離子通道的調節(jié)有關,其中紅色模塊基因主要集中在K+和Ca2+通道上(圖8c)。
![圖8?利用WGCNA分析小鼠竇房結細胞基因共表達調控網絡[14]](http://www.szhpures.com/wp-content/uploads/2022/05/8-3.png)
圖8?利用WGCNA分析小鼠竇房結細胞基因共表達調控網絡[14]
?看完上述內容,單細胞測序分析思路與方法get起來,屬于你的單細胞故事將由你自己講述~
百邁客擁有專業(yè)且強大的單細胞生信分析團隊,在項目實戰(zhàn)中積累了大量的數據挖掘經驗,能提供但不限于以上內容的高級分析,歡迎點擊下方按鈕聯(lián)系我們。

圖9 ?百邁客部分分析實例展示

[1]?http://cole-trapnell-lab.github.io/monocle-release/docs/
[2]?La Manno, Gioele et al. “RNA velocity of single cells.” Nature vol. 560,7719 (2018): 494-498. doi:10.1038/s41586-018-0414-6
[3]?Wu, Xunyao et al. “Single-cell sequencing of immune cells from anticitrullinated peptide antibody positive and negative rheumatoid arthritis.” Nature communications vol. 12,1 4977. 17 Aug. 2021, doi:10.1038/s41467-021-25246-7
[4]?Bergen, Volker et al. “Generalizing RNA velocity to transient cell states through dynamical modeling.” Nature biotechnology vol. 38,12 (2020): 1408-1414. doi:10.1038/s41587-020-0591-3
[5]?Chen, Zhaohui et al. “Single-cell RNA sequencing highlights the role of inflammatory cancer-associated fibroblasts in bladder urothelial carcinoma.” Nature communications vol. 11,1 5077. 8 Oct. 2020, doi:10.1038/s41467-020-18916-5
[6]?Subramanian, Aravind et al. “Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles.” Proceedings of the National Academy of Sciences of the United States of America vol. 102,43 (2005): 15545-50. doi:10.1073/pnas.0506580102
[7]?Chen, Zhaohui et al. “Single-cell RNA sequencing highlights the role of inflammatory cancer-associated fibroblasts in bladder urothelial carcinoma.” Nature communications vol. 11,1 5077. 8 Oct. 2020, doi:10.1038/s41467-020-18916-5
[8]?H?nzelmann, Sonja et al. “GSVA: gene set variation analysis for microarray and RNA-seq data.” BMC bioinformatics vol. 14 7. 16 Jan. 2013, doi:10.1186/1471-2105-14-7
[9]?Chen, Yu-Pei et al. “Single-cell transcriptomics reveals regulators underlying immune cell diversity and immune subtypes associated with prognosis in nasopharyngeal carcinoma.” Cell research vol. 30,11 (2020): 1024-1042. doi:10.1038/s41422-020-0374-x
[10]?Xu, Qianhui et al. “Single-cell RNA transcriptome reveals the intra-tumoral heterogeneity and regulators underlying tumor progression in metastatic pancreatic ductal adenocarcinoma.” Cell death discovery vol. 7,1 331. 3 Nov. 2021, doi:10.1038/s41420-021-00663-1
[11]?https://github.com/broadinstitute/inferCNV
[12]?https://scenic.aertslab.org/
[13]?Langfelder, Peter, and Steve Horvath. “WGCNA: an R package for weighted correlation network analysis.” BMC bioinformatics vol. 9 559. 29 Dec. 2008, doi:10.1186/1471-2105-9-559
[14]?Liang, Dandan et al. “Cellular and molecular landscape of mammalian sinoatrial node revealed by single-cell RNA sequencing.” Nature communications vol. 12,1 287. 12 Jan. 2021, doi:10.1038/s41467-020-20448-x