聚热点 juredian

谈一谈单细胞转录组测序细胞组成分析方法

·背景介绍·

众所周知,疾病、衰老和免疫等各种生物因素对各种组织的细胞组成都有显著影响。因此,对许多研究课题来说,能够精细地研究这些细胞组成成分的变化是特别有趣的方向。而单细胞 RNA 测序技术的最新进展开辟了从组织样本中准确获取大量单个细胞的可能性,为细胞群的差异分析铺平了道路。

图1

但目前使用 scRNA-seq 检测细胞类型组成的变化并非易事,有以下几个限制性因素需要解决:(1)由于单细胞转录组细胞群数据是组成性数据,在现有的技术方案下,某些细胞类型可能更容易受到损坏,从而导致数据存在负偏差及细胞类型比例的更大差异 ;(2) 此外,由于测序成本的限制,多数数据集中样本数目相对较少,导致细胞数目统计结果会存在不准确的情况;(3)通常情况下,不同条件或者因素只会影响一部分类型的细胞, 因此需要开发用于估计细胞类型组成不确定性的方法。

那今天在这里给大家介绍两种不同的统计方法:scDC和scCODA,用于对单细胞转录组学数据进行细胞类型组成成分分析,老师们可以根据自己研究课题需要进行选用。 

·方法介绍·

1.scDC

原理简介

scDC是一种新的统计方法,用于对 scRNA-seq 数据进行差异细胞类型组成分析。scDC通过偏差校正和加速自举置信区间,捕获与每个受试者的细胞类型比例相关的不确定性。它使用 bootstrap 重采样来估计与细胞类型比例估计相关的标准误差,并通过 GLM 和 GLMM 模型执行显著性检验。具体处理步骤如下图所示:

图2

1.预处理单细胞数据并进行细胞类型鉴定 ;

2.使用分层bootstrap生成重采样(有放回的抽取,即一个数据有可以被重复抽取超过一次)数据,然后使用聚类算法进行聚类。每个簇都使用原始数据的参考细胞标签与细胞类型相匹配,这一步重复n次;

3.使用 GLM 拟合每个重采样数据集中的细胞统计情况,每个单独 GLM 拟合模型之间的相关系数估计使用鲁宾规则合并并测试显著性;

4.提取统计的总体估计值;

5.每次引导重新采样都会给出每个患者的细胞类型组成的估计分布,结果以图形方式显示。

结果示例

该分析软件中涉及的主要功能函数及参数如下:scDC_noClustering(cellTypes, group, calCI = TRUE,calCI_method = c("BCa"),ncores = 20,nboot = 1000) ,其中celltype为细胞类型,group为不同条件分组。

图3 | scDC分析柱状图

其中纵坐标为样本名称,横坐标为各种细胞类型在不同条件中的成分占比,纵坐标为不同条件,method为置信区间统计方法:BCa ,percentile和 multinom。

图4 | scDC分析密度图

其中纵坐标为样本名称,横坐标为各种细胞类型在不同条件中的成分占比,cond1为不同条件,method为置信区间统计方法:BCa ,percentile和 multinom。

图5 | scDC分析热图

其中坐标为不同条件,纵坐标为各种细胞类型在不同条件中的成分占比,该值采用1000次自助采样结果中的中位值并针对列进行了scale处理,聚类方式为无监督聚类。

图6 | scDC分析折线图

其中横坐标为不同条件,纵坐标为特定细胞类型在不同条件下的成分占比,该值采用1000次自助采样结果中的中位值, 阴影区域分别表示置信区间上限,下限。

2. scCODA

原理简介

scCODA是一种设计用于在 scRNA-seq 中执行细胞类型组成差异丰度分析的贝叶斯模型,设计灵感来源于微生物组数据的组成分析方法。scCODA框架使用分层 Dirichlet-Multinomial 分布对细胞类型计数进行建模,该分布通过对所有测量的细胞类型比例,而不是通过联合建模来解释细胞类型比例的不确定性。

该模型使用带有对数链接函数的 Logit 正态尖峰和平板先验,以简约的方式估计二元(或连续)协变量对细胞类型比例的影响。由于细胞成分分析始终需要能够识别成分变化的参考, scCODA 支持自动选择适当的细胞类型作为参考(reference_cell_type = “automatic”),当然也可以使用预先指定的参考细胞类型, 这也意味着必须根据所选参考细胞类型来解释 scCODA 检测到的可信变化。此外,该框架集成了其他细胞类型组成差异丰度分析方法,如scDC,t-test等,并完全集成到 Scanpy 生态系统中。

结果示例

不同分组柱状图

图7 | scCODA分组柱状图 

其中横坐标为不同样本或者不同条件,纵坐标为各种细胞类型在不同样本或者不同条件中的成分占比

差异分析箱线图

图8 | scCODA细胞成分分析箱线图 

其中横坐标为不同细胞类型,纵坐标为各种细胞类型在不同条件中的成分占比

·应用实例·

2021年底发表的结直肠癌肝转移的单细胞时空免疫图谱文章中,作者使用scDC软件来估计不同分组的免疫细胞差异, 结果表明一些免疫抑制细胞特异性地存在于肝转移中,其中观察到SPP1+巨噬细胞和MRC1+ CCL18+巨噬细胞显著增加,中性粒细胞作为潜在的促瘤参与者也在肝转移中出现了富集,这些发现得到了后续的mIHC量化结果的验证,进一步证实了肝转移中潜在的抑制性TME。结合TCGA中结直肠癌人群中scRNA-seq定义的免疫细胞亚群的预后信息,发现原发性肿瘤中MRC1+ CCL18+巨噬细胞和SPP1+巨噬细胞的高分都预示着预后更差。基于这些结论,文章推断特定的巨噬细胞亚群可能在结直肠癌肝转移前肿瘤生态位形成中起根本作用。

图9 | 结直肠癌肝转移免疫细胞成分分析

在scCODA算法文章中,作者针对早期发表的COVID-19患者支气管肺泡免疫细胞数据, 比较了健康对照组 (4例样本)、重症组 (6例样本)和轻症组( 3例样本)之间支气管肺泡灌洗液中主要细胞类型的组成变化 。

该研究最初报告了pDC细胞在健康组与轻症组, 轻症组与重症组均存在显著差异变化;相对于健康组样本,mDCs细胞比例在重症组中降低;相对于轻症组,T细胞比例在重症组中也降低。由于样本较少,采用多重测试校正后,导致只有pDC细胞的结论仍然成立。而通过scCODA分析, 证实了 T 细胞在重症病例出现耗竭现象,并确定了NK 细胞在轻症组显著增加;相对于健康组和轻症组,中性粒细胞在重症组显著增加 。

这些结论得到了FACS验证并与其他研究结果一致:T细胞丰度与严重程度的相关性已得到充分确立,并已被用作严重病例的危险因素;较高的中性粒细胞比例与重症相关联, 并被怀疑是宿主反应加剧的主要驱动因素。

图10 | 不同症状COVID-19患者的支气管肺泡免疫细胞成分分析

今天的介绍就到这里了

欢迎百度搜索欧易生物——访问欧易生物官网——了解单细胞转录组测序技术

原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

搜索建议:
热议

 教你推算出生时辰与吉凶

教你推算出生时辰与吉凶时间就是生命,同时时间也是命运。八字算命,以出生的年月日时来组合成天干地支,进而推算人的一生祸福。但很多朋友在咨询李泽顺老师的时候,都不记...(展开)

热议

 父母如何培养孩子的好习惯?

习惯是一种常见的行为方式,是一个人以规律和重复的方式做事情。在别人看来很难的事情,对于养成了该习惯的人来说,是没有难度的,是自然而然就能够完成的。家长都希望孩子...(展开)