最新1区9+非肿瘤纯生信,逻辑清晰易懂,机器学习筛选关键基因的纯生信也可以发高水平期刊,抓紧上车!

生信小课堂


影响因子:9.186

关于非肿瘤生信,我们也解读过很多,主要有以下类型

1 单个疾病WGCNA+PPI分析筛选hub基因。
2 单个疾病结合免疫浸润,热点基因集,机器学习算法等。
3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
4 基于分型的非肿瘤生信分析
5 单细胞结合普通转录组生信分析

目前非肿瘤生信发文的门槛较低,欢迎有需要的朋友!

研究概述:

本研究首先使用R语言在三个基因表达数据集中找到DEGs并进行基因集富集分析。随后,使用WGCNA选择的关键模块基因,利用3种机器学习算法鉴定出402个枢纽基因。接着使用ROC曲线和列线图以验证候选枢纽基因(CD177、CYSTM1和MMP8)的识别性和有效性。此外,通过CIBERSORT,使用细胞类型鉴定评估小儿败血症的炎症和免疫状态,进一步研究了诊断标志物与浸润免疫细胞之间的关系。

研究流程图

研究结果:

一、小儿败血症DEGs的筛查与GSEA

1. 两组患者共有556个DEGs,包括381个上调基因和175个下调基因。

2. 对小儿败血症患者和健康对照进行了GSEA研究生物信号通路,小儿败血症患者的凝血、补体、IL6-JAK-STAT3信号传导、炎症反应和NF-κB介导的TNFα信号显著富集。


二、DEGs的功能富集分析

1. DO分析结果显示,这些DEGs与肺部疾病、动脉硬化、肝炎、动脉粥样硬化、动脉硬化性心血管疾病、细菌性传染病、原发性细菌性传染病、阻塞性肺病、结核病和支气管疾病有关(补充图2b)。

2. GO富集分析表明,DEGs具有免疫应答调节信号通路、免疫应答活化、细胞因子产生正向调节、白细胞介导免疫、T细胞活化和髓系白细胞活化(补充图2c)。

3. KEGG分析与造血细胞谱系、金黄色葡萄球菌感染、Th1和Th2细胞分化以及Th17细胞分化有关(补充图2d)。


三、儿科败血症共表达基因模块的鉴定

1. 在儿科脓毒症数据集中使用WGCNA来定位由许多基因共表达的基因模块。首先,将来自两个数据集的样本分为两组,即小儿败血症组和正常组(补充图3a)。然后,基于0.8的尺度独立性,选择13作为软阈值功率β,以确保无标度网络的生物学意义(补充图3b,c)。


2. 通过分层聚类分析和基因树状图的动态分支切割方法,将基因分为12个模块(补充图.3d,e)。浅青色、蓝色和浅绿色模块与儿科败血症显著相关,并选择其进一步分析(补充图3f)。


四、诊断标志物的筛查和验证

1. 通过维恩图比较DEGs和关键模块基因的重叠区域,识别出402个重叠的基因区域(图2a)。

2. 使用三种机器学习算法来识别特征基因:SVM-RFE(图2b); 随机森林(图2c, d); LASSO回归分析(图2e, f)。



3. 这三种算法将CYSTM1,MMP8和CD177鉴定为重叠基因(图3a)。

使用rms软件包开发基于三个标志基因诊断儿科败血症的列线图模型(图3b)。

4. 根据决策曲线分析(DCA)的结果,列线图模型具有更好的临床效益(图3c)。AUC分别为0.988、0.973和0.986表明生物标志物具有较高的预测价值准确性(图3d)。



5. 在GSE13904验证集中,小儿脓毒症组CYSTM1、MMP8和CD177的表达明显高于对照组(图3e)。AUC分别为0.968、0.964和0.957的ROC曲线表明它们在GSE13904验证集中可能是有价值的生物标志物(图3f)。

五、免疫细胞浸润结果

1. 采用CIBERSORT算法评估免疫细胞浸润状态,与正常样本相比,小儿脓毒症样本中单核细胞、M0、M1、M2巨噬细胞、静息肥大细胞、活化肥大细胞、嗜酸性粒细胞和中性粒细胞的比例普遍较高;

2. 幼稚B细胞、CD8+T细胞、静息CD4+记忆T细胞、活化CD4+记忆T细胞、Trges、静息NK细胞、活化NK细胞和静息树突状细胞的比例相对较低(补充图4)。


3. 根据相关性分析的结果,CYSTM1,MMP8和CD177与多种免疫细胞具有显著程度的联系(补充图5)。


研究总结:

本文不仅整合了儿科败血症的多个高通量测序数据进行分析,更重要的是首次使用机器学习来筛选特征基因(CD177、CYSTM1和MMP8)。此外,还研究了诊断标志物与免疫细胞之间的关系,构建列线图用于儿科脓毒症诊断。

你可能感兴趣的:(最新1区9+非肿瘤纯生信,逻辑清晰易懂,机器学习筛选关键基因的纯生信也可以发高水平期刊,抓紧上车!)