代谢组数据分析(二十):通过WGCNA识别核心代谢物

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!

代谢组数据分析(二十):通过WGCNA识别核心代谢物_第1张图片

文章目录

    • 介绍
      • 识别核心基因
    • 加载R包
    • 导入数据
    • 数据预处理
    • 检查数据完整性
    • 计算软阈值soft
    • 根据软阈值构建接矩阵和拓扑重叠矩阵
    • 聚类并构建网络
    • 拓扑重叠热图
    • 查看具体模块的代谢物表达热图
    • 识别表型相关模块
    • 与分组相关的模块
    • 获取核心代谢物 (hub metabolites)
    • 导出网络数据用于Cytoscape
    • 总结
    • 系统信息

介绍

WGCNA(加权基因共表达网络分析,Weighted Gene Co-expression Network Analysis)是一种用于系统生物学和转录组学数据分析的计算方法。它由美国斯坦福大学的Steve Horvath博士和普林斯顿大学的Uli Schreiber博士共同开发。WGCNA的主要目标是通过构建基因共表达网络来识别基因模块(modules),这些模块是一组具有相似表达模式的基因集合,并且这些模块可能与特定的生物学过程或疾病状态相关。WGCNA分析的主要步骤包括:

  1. 数据预处理:包括标准化处理,以消除不同样本或不同基因之间的量纲差异。
  2. 构建共表达网络:通过计算基因对之间的相关系数并应用软阈值幂来构建加权共表达网络。软阈值的目的是使网络的连接强度符合无尺度网络的特性。
  3. 层次聚类和模块识别:使用拓扑重叠矩阵(TOM)和动态剪切方法对基因进

你可能感兴趣的:(代谢组数据分析,数据分析,数据挖掘,r语言,数据可视化)