2022-05-15

Nat Biothech | 通过空间转录组学与细胞类型对应关系

原创 存在一棵树 图灵基因 2022-05-15 19:19

收录于合集#前沿分子生物学技术

撰文:存在一棵树

IF=54.902

推荐度:⭐⭐⭐⭐⭐

亮点:

开发了一种基于条件自回归的反卷积的方法,用于对空间转录组学中的细胞类型进行空间信息的反卷积。


2022年5月2日,美国密歇根大学安娜堡分校生物统计学系的周翔教授在Nature Biotechnology 上发表了一篇名为Spatially informed cell-type deconvolution for spatial transcriptomics的文章。本文介绍了一种反卷积方法,即基于条件自回归的反卷积,它可将来自单细胞 RNA 测序 (scRNA-seq) 的细胞类型特异性表达信息与跨组织位置的细胞类型组成对应。


空间转录组技术利用空间定位信息对许多组织位置进行基因表达谱分析,从而能够表征组织上的转录组景观,但大多数技术的空间分辨率有限,几乎所有基于测序的技术都会收集组织位置的表达测量值,但这些组织位置是由几个到几十个属于潜在不同细胞类型的单细胞组成,所以其实每个测量位置都属于细胞混合物。如图1所示,本文开发了一种名为基于条件自回归的反卷积 (CARD) 的方法,用于对空间转录组学中的细胞类型进行这种空间信息的反卷积;其通过使用来自 scRNA-seq 数据的细胞类型特异性基因表达信息在对空间转录组学数据进行反卷积,推断每个空间位置的细胞类型组成。且与MuSiC、RCTD、SPOTlight、cell2location、SpatialDWLS和 Stereoscope 立体镜五种反卷积方法相比,CARD都具有优势。


本文将CARD与MuSiC、RCTD、SPOTlight、Cell2location、SpatialDWLS和 Stereoscope 六种反卷积方法进行了比较,发现CARD都具有优势。首先是小鼠嗅球(MOB)的数据, MOB 数据由四个主要的解剖层组成,这些解剖层以基于 H&E 染色的由内而外的方式进行注释:颗粒细胞层 (GCL)、二尖瓣细胞层 (MCL)、肾小球层 (GL)和神经层 (ONL)。如图2所示, CARD 推断的细胞类型组成准确地描绘了这种预期的分层结构,且通过可视化估计的细胞类型组成矩阵的第一优势细胞类型(PC1)很明显,相比之下MuSiC、SPOTlight、SpatialDWLS 和Stereoscope 无法区分三个外层。


接下来其对来自 ST的人胰腺导管腺癌 (PDAC) 数据进行测试,PDAC 数据包含由组织学家基于 H&E 染色注释的多个组织区域(癌症、胰腺、导管和基质区域)。如图3所示,通过反卷积,CARD 将各种胰腺和肿瘤细胞类型定位到不同的组织区域,且估计的PC1组成的矩阵清楚地捕获了癌症和非癌症区域之间、导管和基质区域之间以及胰腺和导管区域之间的总体区域分界;CARD 还揭示了癌症和非癌症区域之间两个巨噬细胞亚群的不同分布,代表了其他方法遗漏的癌症组织区域划分的关键功能特征。


之后,其继续分析了来自 Slide-seqV2 和 10x Visium 的小鼠大脑海马区数据。海马主要由CA1/CA2、CA3和齿状回三个区域组成,其可通过每个位置的总唯一分子标识符(UMI) 计数进行可视化。如图4所示,CARD 推断的细胞类型组成准确地描绘了海马的三种解剖结构,组成 PC1 准确地捕捉了海马的弯曲形状,比其他三种方法更准确;对标记基因的仔细检查也进一步证实了 CARD 反卷积的准确性,再次支持 CARD 比其他方法更为准确。

除此之外,其还进一步开发了 CARDfree,它是 CARD 的扩展,用于不需要 scRNA-seq 参考数据的无参考细胞类型反卷积。


综上所述,本文开发了CARD,用于对空间转录组学数据进行准确和空间知情的反卷积。其具有三个强大的功能:首先CARD 模型标准化空间转录组学数据,可以利于过度分散泊松模型直接建模原始计数数据的扩展;其次CARD可探索使用其他内核(例如周期性内核)或将组织学图像信息作为附加坐标,将来可能会捕获多样化和丰富的空间相关模式;第三,CARD 的空间插补功能不仅有助于构建精细的空间图,还有助于在多个scRNA-seq 资源可用时选择 scRNA-seq 参考。

教授介绍


周翔,现为美国密歇根大学安娜堡分校生物统计学系生物统计学副教授。他2004年毕业于北京大学生物学专业; 2010年获得杜克大学统计学硕士学位和神经生物学博士学位;后在芝加哥大学完成了人类遗传学博士后培训;2014年加入密歇根大学之前,他曾是芝加哥大学统计系的William H. Kruskal讲师。他的研究重点是开发用于遗传和基因组研究的统计方法和计算工具,这些研究通常涉及大规模和高维的数据;例子包括全基因组关联研究和各种功能基因组测序研究,如批量和单细胞RNA测序以及亚硫酸氢盐测序。其通过开发新的分析方法,试图从这些数据中提取重要信息,并推进对各种人类疾病和疾病相关数量性状表型变异的遗传基础的理解。


参考文献

1Ma, Ying, and Xiang Zhou.“Spatially informed cell-type deconvolution for spatial transcriptomics.”Nature biotechnology, 10.1038/s41587-022-01273-7. 2 May. 2022.

你可能感兴趣的:(2022-05-15)