2021-10-22

Nat Biotech | 单细胞Hi-C数据分析识别多尺度3D基因组特征

原创 图灵基因 图灵基因 今天

收录于话题#前沿生物大数据分析

单细胞Hi-C可以识别3D染色质组织的细胞间变异性,这是有关细胞中基因组折叠和基因表达作用的关键信息。但是,鉴于测量的相互作用的稀疏性,Hi-C数据的分析一直具有挑战性。现在,卡内基梅隆大学计算生物学系的一个团队开发了一种新算法,为以前所未有的分辨率演示这一过程提供了一个强大的工具。


这项工作发表在《Nature Biotechnology》杂志上的一篇题为“Multiscale and integrative single-cell Hi-C analysis with Higashi”的论文中。



该算法被称为Higashi,基于超图表示学习(hypergraph representation learning),这是一种可以在应用程序中推荐音乐并执行3D对象识别的机器学习形式。它可以“结合单个细胞之间的潜在相关性,以增强接触图的整体插补。”



该算法是第一个在超图上使用复杂神经网络来提供单细胞基因组组织的高清晰度分析的工具。普通图将两个顶点连接到一个交点(称为边),超图将多个顶点连接到边。



Higashi算法适用于单细胞Hi-C,它可以创建单细胞中同时发生的染色质相互作用的快照。Higashi对复杂组织和生物过程中单个细胞中的染色质组织进行了更详细的分析,以及染色质相互作用如何因细胞而异。这一分析使科学家能够看到染色质在细胞间折叠和组织的详细变化——包括那些在确定健康影响方面可能很微妙但很重要的变化。



“基因组组织的变异性对基因表达和细胞状态有着重要影响。”卡内基梅隆大学计算机科学学院计算生物学教授Jian Ma博士说。



计算机科学学院的博士生Ruochi Zhang与研究生Tianming Zhou和Ma一起,以一种传统的日本甜品命名Higashi,延续了他开发的其他算法的传统。“他对研究充满热情,但有时也有幽默感。”Ma说。


Higashi算法还允许科学家同时分析与单细胞Hi-C联合分析的其他基因组信号。最终,该功能将能够扩展Higashi的能力,考虑到Ma预计在未来几年通过他的中心所属的NIH 4D核组计划等项目看到的单细胞数据的预期增长,这是及时的。这种数据流将为设计更多算法创造更多机会,从而促进对人类基因组在细胞内的组织方式及其在健康和疾病中的功能的科学理解。


“这是一个快速发展的领域。”Ma说,“实验技术正在迅速发展,计算的发展也是如此。”


作者写道,Higashi“优于现有的单细胞Hi-C数据嵌入和插补方法,能够识别单细胞中的多尺度3D基因组特征,如区隔化和TAD样结构域边界,从而可以精确描述细胞间的变异性。”此外,与单独分析两种模式相比,Higashi可以将在同一细胞中联合分析的表观基因组信号纳入hypergraph表征学习框架中,从而改进单核甲基-3C数据的嵌入。


这项工作是作为一个多机构研究中心的一部分进行的,旨在更好地了解细胞核的3D结构以及该结构的变化如何影响健康和疾病中的细胞功能。该中心耗资1000万美元,由美国国立卫生研究院资助,由卡内基梅隆大学领导,Ma是其首席研究员。

你可能感兴趣的:(2021-10-22)