007-单细胞分析揭示葡萄膜黑色素瘤新的进化复杂性
刘小泽写于2020.5.5 看这篇的原因是看到它的方法部分写的很详细,提供了很多参数可以参考。但是CNV和免疫部分我研究不深,所以下面也不会介绍很详细
1 文章信息
题目:Single-cell analysis reveals new evolutionary complexity in uveal melanoma
发表日期:2020年1月24日
杂志:Nature Communications
文章在:https://www.nature.com/articles/s41467-019-14256-1
DOI:https://doi.org/10.1038/s41467-019-14256-1
附件在:https://static-content.springer.com/esm/art%3A10.1038%2Fs41467-019-14256-1/MediaObjects/41467_2019_14256_MOESM1_ESM.pdf
摘要
葡萄膜黑色素瘤(UM)是一种高度转移性癌症,与皮肤黑色素瘤不同,它对免疫检查点疗法无反应。
葡萄膜恶性黑色素瘤是成年人中最多见的一种恶性眼内肿瘤,在国外其发病率占眼内肿瘤的首位,在国内则仅次于视网膜母细胞瘤,居眼内肿瘤的第二位。此瘤的恶性程度高,眼后极部是好发部位。易经经血流转移,85%转移至肝脏,预后较差。
作者使用来自8个原位癌和3个转移癌样本的59,915个肿瘤和非肿瘤细胞进行单细胞测序,来检查肿瘤微环境。肿瘤细胞展示了新的亚克隆细胞基因组复杂性和转录状态。
肿瘤微环境是一个动态网络,它包括肿瘤细胞、细胞外基质和间质组织等,是影响肿瘤转移的关键因素
肿瘤浸润免疫细胞检测到了之前无法识别的多种细胞类型,包括主要表达LAG3(一种免疫检查点的marker)而非PD-1或CTLA-4的CD8 + T细胞。
免疫检查点是指免疫系统的内在调控机制,可保持自身耐受性,并有助于避免在生理性免疫应答期间的附带损伤 免疫检查点抑制剂的前世今生:http://rehab.dxy.cn/article/503316
- CD4+ 或 CD8+ 的 T 细胞表面存在的一种免疫球蛋白,被称之为细胞毒性淋巴细胞抗原 4,亦称为CTLA-4。 CTLA-4 调节初始和记忆性 T 细胞的早期活化程度
- 1992 年,日本学者 Ishida 从凋亡的小鼠 T 细胞杂交瘤 中发现了 PD-1。因其可令 T 细胞失活,将其命名为程序性死亡受体 1,亦称为PD-1。PD-1 主要限制慢性炎症、感染或癌症中的 T 细胞活性,从而限制自身免疫
V(D)J分析发现了克隆扩增的T细胞,表明它们能够发起免疫反应。
Illumina的免疫学研究综述:http://web.illumina.com.cn/landing/products_view.asp?newsid=155
B细胞和T细胞构成了免疫系统的适应性分支,并能够识别繁多的抗原。 与体细胞相比,B 细胞和 T 细胞是独特的,其发育和成熟是由生殖细胞系中未编码的 DNA 序列决定的。相反,在成熟过程中,这些细胞经历了**可变区(V)、多样区(D)和接合区(J)**基因片段的重排,以便形成独特的序列。
Class 1B UM的惰性肝转移被克隆扩增的浆细胞浸润,表明具有抗体介导的免疫
UM分类参考:https://www.myuvealmelanoma.com/health-care-professionals/decisiondx-um-summary/
- Class 1A: Very low risk, with a 2% chance of the eye cancer spreading over the next five years
- Class 1B: Low risk, with a 21% chance of metastasis over five years;
- Class 2: High risk, with 72% odds of metastasis within five years.
最后,对于高危UM患者,LAG3可能为新的免疫检查点抑制剂研究提供思路
3 方法
3.1 样本选择
手术切除眼或肝后立即分离肿瘤区域的单细胞。转移性肿瘤组织特意从肿瘤-肝脏交界的远端选取,避免混入正常的肝脏组织。其余肿瘤组织样本则进行DecisionDx-UMseq的DNA和RNA分析
DecisionDx-UM是一种预后测试,可准确判断与眼部黑色素瘤相关的转移风险 (https://en.wikipedia.org/wiki/DecisionDx-UM)
3.2 单细胞RNA测序
总共11个样本,选择10X测序,样本编号与取样位点对应如图
- UMM061, UMM062, UMM063, UMM064, UMM065, UMM066, UMM069, UMM067L, UMM041L以及BSSR0022样本使用三种文库制备方案:Chromium Single Cell 5’ Library & Gel Bead Kit v2、Chromium Single Cell V(D)J Human T Cell Enrichment Kit、Chromium Single Cell V(D)J Human B Cell Enrichment Kit。
- UMM059样本使用Chromium Single Cell 3′ Library & Gel Bead Kit v2文库制备。
- 5’端文库可以捕获10,000细胞,3‘端文库(UMM059样本)可捕获5,000细胞。每个样本使用独立的Chromium Single Cell A Chip。3‘和5’基因表达文库使用 NextSeq 500测序,B细胞和T细胞的VDJ文库使用MiSeq测序
关于10x Genomics 建库流程,可以看: http://www.novogene.com/views/default/data/documents/10x_yk.pdf
3.3 单细胞DNA测序
UMM069 和 UMM041L样本使用Chromium Single Cell DNA Library & Gel Bead Kit + Chromium Single Cell C and D Chips进行文库制备,捕获500细胞。使用NextSeq 500测序
3.4 DecisionDx-UMseq的DNA和RNA分析
肿瘤RNA样本用来看基因表达量,DNA用来找变异
Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013).
4 数据分析
4.1 【重头戏】单细胞RNA分析
4.1.1 上游:
使用CellRanger (version 2.1.1),利用mkfastq
从原始的BCL文件得到FASTQ,然后count
定量【比对到GRCh38 Ensembl build 84 genome (version 1.2.0)】。
4.1.2 下游:基于R 3.5环境
读入数据:11个样本的数据利用Seurat2.3.4 的 Read10X()
读入,利用aggregate
进行整合。接着进行数据过滤(标准是:UMI大于400, 每个细胞包含100-8000个基因,线粒体含量小于10%)。没有进行样本批次矫正,结果得到了59,915个细胞
归一、标准化:利用LogNormalize
进行归一化,设置scale factor = 10,000
,然后利用Scale.Data()
进行标准化,指定vars.to.regress
去除UMI和线粒体对差异的影响。
细胞周期分析:利用CellCycleScoring()
【来自:Tirosh, I. et al. Dissecting the multicellular ecosystem of metastatic melanoma by single-cell RNA-seq. Science 352, 189–196 (2016).】
找高变化基因:设定范围是normalized expression 介于0.125 和 3;quantile-normalized variance 大于0.5,找到1865个高变化基因
降维:PCA前20个主成分 + tSNE (利用RunTSNE()
)
寻找Doublets(一个孔出现两个细胞):DoubletFinder V2.0.2
【来自:McGinnis, C. S., Murrow, L. M. & Gartner, Z. J. DoubletFinder: doublet detection in single-cell RNA sequencing data using artificial nearest neighbors. Cell Syst. 8, 329–337.e4 (2019).】发现除巨噬细胞或单核细胞以外,很少会出现doublets(<10%)
巨噬细胞 Macrophage:是一种位于组织内的白细胞,源自单核细胞 单核细胞 Monocyte:是人体免疫系统中的一种白细胞,单核细胞来源于骨髓中的前体细胞,在血管内为单核细胞,血管外就变成巨噬细胞 来自:https://zh.wikipedia.org/wiki/%E5%B7%A8%E5%99%AC%E7%BB%86%E8%83%9E
需要注意:两个细胞粘在一起这种Doublet现象,不一定是分析的假象。任何细胞都不是一个孤岛,在结核病和登革热发生时,单核细胞成为疾病的储存库,因此T细胞很有可能与单核细胞接触并形成doublet 来自:「在流式分析中排除doublet,我们可能做错了」https://www.ebiotrade.com/newsf/2019-6/2019627161132438.htm
细胞亚群:利用 FindClusters()
,使用前20个主成分,resolution=3
,得到58个cluster。【下图:a图按来源划分;b图是全部的cluster】
然后用marker基因鉴定细胞类群:
- Tumor cells:MLANA, MITF, and DCT
- Tumor cell继续分:按照PRAME 和 gene expression profile (GEP)基因
- T Cells (CD3D, CD3E, CD8A)
- B cells (CD19, CD79A, MS4A1 [CD20])
- Plasma cells (IGHG1, MZB1, SDC1, CD79A)
- Monocytes and macrophages (CD68, CD163, CD14)
- NK Cells (FGFBP2, FCG3RA, CX3CR1)
- Retinal pigment epithelium (RPE65)
- Photoreceptor cells (RCVRN)
- Fibroblasts (FGF7)
- Endothelial cells (PECAM1, VWF)
免疫细胞分析:利用SubsetData()
最后得到了16470个免疫细胞,经过归一化、找高变化基因(4423个)、PCA、tSNE(resolution=10),得到74个cluster,再传给AverageExpression()
计算每个cluster的平均RNA表达量
4.2 单细胞CNV分析
利用Cellranger DNA (version 1.0.0)的mkfastq
将BCL转为fastq,利用cnv
得到CNV数据(中间过程需要比对到GRCh37 build 87 genome),结果可视化利用Loupe scDNA Browser (version 1.0.0)。
过滤掉免疫浸润以及非肿瘤细胞:设定subtree depth
4.3 inferCNV和克隆性分析
inferCNV:https://github.com/broadinstitute/inferCNV
inferCNV
用于分析体细胞大规模染色体拷贝数变化(copy number alterations, CNA), 例如整条染色体或大片段染色体的增加或丢失(gain or deletions)。- 原理:以一组"正常"细胞作为参考,分析肿瘤基因组上各个位置的基因表达量强度变化. 通过热图的形式展示每条染色体上的基因相对表达量
- 横坐标是各个基因在染色体的分布(染色体经过了排序),纵坐标是各个样本
- 表达量差异来源于肿瘤细胞的表达量减去正常细胞的表达量,红色部分表示这部分染色体区域的基因发生扩增,蓝色表示缺失
UPhyloplot2:https://github.com/harbourlab/UPhyloplot2,绘制肿瘤系统进化树
4.4 SCENIC 分析
利用pySCENIC对8598个高质量UM细胞归一化后的表达矩阵进行计算,用GRNboost2进行基因调控网络重建。使用了24453个cisTarget Human motif database v9 motifs (https://resources.aertslab.org/cistarget/motif2tf/motifs-v9-nr.hgnc-m0.001-o0.0.tbl)
4.5 Monocle 2分析
使用7947个高质量UM细胞
选轨迹推断基因:用dispersionTable()
计算每个基因在细胞中的表达量相对于平均表达量的差异
结果可视化:plot_cell_trajectory()
, plot_complex_cell_trajectory()
4.6 免疫细胞V(D)J 分析
每个B细胞和T细胞文库的BCL文件也是用cellranger分析,先是mkfastq
得到fastq,然后vdj
pipeline:https://support.10xgenomics.com/single-cell-vdj/software/pipelines/latest/using/vdj
5 结果
5.1 单细胞RNA测序分析
目的是探索单细胞水平的肿瘤微环境
对59915个细胞进行分群,发现既有肿瘤细胞又有非肿瘤细胞
从原位癌class1(左)到转移癌class2(右),细胞类型复杂度上升
另外用GEP clinical prognostic test 方法,看12个基因在细胞类群的表达,其中5个基因(EIF1B, HTR2B, ECM1, CDH1, and ROBO1)主要在肿瘤细胞表达,有一个(SATB1)主要在T细胞中表达,其余二者均有。表示GEP测试的准确性可能取决于从复杂的肿瘤微环境取样过程
GEP clinical prognostic test : Harbour, J. W., Chen, R. The DecisionDx-UM gene expression profile test provides risk stratification and individualized patient care in uveal melanoma. PLoS Curr. 5 (2013)
5.2 转录轨迹分析
目的是探索UM细胞的转录状态。
SCENIC的结果是: class2中富集到了肿瘤蛋白基因MYC、JUN,bHLH-PAS缺氧相关转录因子ARNT
然后monocle2拟时序分析,得到了16种状态,主要分成2支(class1 和class2)
class1的细胞主要在1-4、14-16状态,class2主要在5-13,表示UM的整体分子特征主要就体现在class1和class2中
然后又用branched expression analysis modeling (BEAM) 和层次聚类的方法得到cluster,并且鉴定在不同状态富集的基因
下图是其中一个样本的结果(每个样本都进行了同样的操作),a是定量拟时序,b是细胞状态拟时序,c是亚克隆的拟时序,d是4个基因(JUN, MITF, HLA-A, and MYC)表达量的拟时序【这4个基因分别对应4种不同状态:TNFA/NFKB, differentiation, HLA/immune, and MYC】,e是细胞周期拟时序
可以看到单个样本中,这些转录状态在亚克隆和各个细胞周期中都有分布
整合的结果如下:
5.3 免疫细胞V(D)J 分析
肿瘤微环境中9441个免疫细胞,分群如下:
e
每个免疫细胞cluster的平均RNA表达量:
每个肿瘤样本免疫细胞中各个亚型占比:T细胞在所有样本都有体现,包括CD8+ cytotoxic T细胞、CD8+ T effector memory细胞,大部分T细胞都是CD8+,少部分是CD4+(包括:follicular helper cells, FOXP3+ regulatory cells, naïve lymphocytes)
单细胞VDJ结果:克隆扩增T细胞只存在于3个样本中
CD8+ T cell expression of exhaustion-associated immune checkpoint molecules is strongest for LAG3, variable for TIGIT, and minimal for PDCD1 (PD1), CTLA4, HAVCR2 (TIM3), and TNFRSF9
6 意义
Class1 UM的潜伏期长和转移率低可能是由于免疫监视,而免疫监视可能是由EIF1AX和SF3B1突变产生的新抗原引起的。 这种可能性可能具有临床意义,值得进一步研究。
scRNA-seq V(D)J分析显示UM样品中克隆扩增的T细胞或浆细胞表明肿瘤浸润的免疫细胞能够引发反应,表明肿瘤突变程度低并不是UMs对检查点抑制剂反应差的唯一原因。
发现LAG3是UM中的主要衰竭指标,至少可以部分解释先前针对CTLA4和PD1的检查点抑制的失败。 LAG3是第三个针对患者的免疫抑制受体,表现出与PD1的显着协同作用,不仅在CD8 + T细胞上表达,而且在NK细胞和调节性T细胞上表达,并且具有独特的特性,可以显著扩大检查点抑制剂疗法的疗效。 因此,LAG3抑制剂正在多种癌症的大量临床试验中进行评估。