业务热线:

027-86925668

公司动态

12种机器学习+113种组合的纯生信文!临床医生没时间也能狂发多篇!

今天给各位老师分享一篇套路满满的生信分析文章,这篇文章的研究逻辑对时间不充裕的临床医生太实用了,没时间也能连发多篇!文章研究的主要亮点之处在于构建了一个基于12种机器学习算法113种组合的集成程序,用于间质性膀胱炎相关基因的重度抑郁症诊断。除了机器学习这一妙用,作者还进行了其他常见分析内容:PPI网络、功能富集、免疫浸润分析、药物敏感性预测等。

题目:一种集成机器学习框架,用于开发和验证基于间质性膀胱炎相关基因的重度抑郁症诊断模型

英文名:An integrated machine learning framework for developing and validating a diagnostic model of major depressive disorder based on interstitial cystitis-related genes

杂志 Journal of Affective Disorders

影响因子:4.9

发表时间:2024年6月

研究背景(Introduction):间质性膀胱炎 (IC) 是一种病因不明的持续性疼痛疾病,对女性的影响尤为严重,没有已知的治愈方法。根据先前的研究,抑郁症似乎是 IC 患者中常见的合并症。重度抑郁症 (MDD) 是导致自杀率的主要原因。所以,在 IC 患者中及早发现 MDD 至关重要,以便在临床症状出现之前开始治疗。目前还没有 MDD 和 IC 之间敏感性和特异性强的生物标志物。在此,作者利用生物信息学和机器学习算法确定了 IC与 MDD 相关的关键标志物。

研究思路(figure1  研究的主要流程图):

材料方法:

1、 研究方法:通过分析GEO 数据集的转录组数据,包括 MDD 和 IC 患者的转录组数据,以开发和验证作者构建的模型。去批次效应后,鉴定出各自疾病组和对照组之间的差异表达基因 (DEGs)。然后对条件的共享 DEG 进行功能富集分析。此外,通过ssGSEA进行免疫浸润分析。通过探索 12 种机器学习算法的 113 种组合,在训练集上进行 10 倍交叉验证,然后在测试集上进行外部验证,构建了 MDD 诊断模型。最后,利用“Enrichr”平台识别出MDD的潜在药物。

研究结果:

1、 鉴定与 IC 和 MDD 相关的差异表达

鉴于 MDD 和 IC 之间的相互关系,对 IC 和 MDD 进行了 limma 分析,以揭示 IC 相关 MDD 中的致病基因。在 IC 队列中,确定了 1531 个 DEG,其中 906 个上调和 625 个下调。MDD组产生100个DEGs,其中33个上调,67个下调。 IC 和 MDD 之间 DEGs有 21 个

图1

2、IC相关MDD中涉及的致病基因的功能富集

通过 GeneMANIA 数据库对候选基因进行PPI网络分析,并使用 GO、KEGG 和 DO 进行功能分析,以确定潜在的作用机制。 分析显示,IC-MDD与机会性真菌病、肾衰竭、胰腺炎肠道疾病显著相关(图 2)。

图 2

3、 IC 和 MDD 中的免疫细胞浸润分析

图3

对 IC 和 MDD 之间重叠的 DEG 的功能和通路分析揭示了与炎症和免疫过程的显着关联。相对于对照样品,IC样品表现出1型辅助性T细胞记忆B细胞、巨噬细胞、未成熟树突状细胞、γδ-T细胞、效应记忆CD8+ T细胞和效应记忆CD4+ T细胞的富集(图3A). 箱线图分布图 3B 表示 MDD 队列中巨噬细胞、内皮细胞和活化树突状细胞的比例升高,与对照组相比,效应记忆 CD8+ T 细胞的丰度降低。

4、通过机器学习识别具有诊断价值的枢纽基因,并开发IC相关MDD的诊断模型

在 10 倍交叉验证过程中,总共结合了 12 种机器学习算法,以确定筛选的 21 个共因的最稳健的诊断模型。通过集成Stepglm[both]和XGBoost算法,建立了性能best的最终模型。Stepglm[both]算法鉴定出11个关键基因(ABCD2、ATP8B4、TNNT1AKR1C3、SLC26A8、S100A12、PTX3、FAM3B、ITGA2B、OLFM4、BCL7A),而XGBoost算法过滤出最可靠的模型。模型展现出稳健的校准性能,与整体队列相比,模型在 60 岁以下患者亚组或男性中表现出更高的诊断性能。

图4

5、MDD诊断模型的比较

作者将自己构建的MDD诊断模型于其他同类模型进行比较,作者的模型在训练和测试队列的 AUC 方面都表现出优越的性能。

2、 候选药物的鉴定

作者使用 Enrichr 上的 DSigDB 药物数据库分析模型基因,以确定潜在的靶向药物。排名前10位的候选药物依次为表没食子儿茶素没食子酸酯硼替佐米、3-(1-甲基吡咯烷-2-基)吡啶、苯、阿司匹林、氧、达沙替尼佛波醇12-肉豆蔻酸酯13-乙酸酯、OuabainThapsigargin表2).

Table 2. Bladder pain syndrome/interstitial cystitis (IC) and major depressive disorder (MDD) gene-targeted drugs.

TermP valueCombined scoreGenes
Epigallocatechin gallate0.022330018.40834BCL7A;ITGA2B;AKR1C3;PTX3
Bortezomib0.010677037.18759BCL7A;AKR1C3;PTX3
3-(1-methylpyrrolidin-2-yl) pyridine0.002193790.22624ITGA2B;PTX3;OLFM4
Benzene0.043202622.06873ITGA2B;PTX3
Aspirin0.036529725.56394ITGA2B;AKR1C3
Oxygen0.032221528.46807AKR1C3;PTX3
Dasatinib0.029765930.44088AKR1C3;PTX3
Phorbol 12-myristate 13-acetate0.027710632.31902ITGA2B;PTX3
Ouabain0.017592546.70676S100A12;PTX3
Thapsigargin0.01345177557.57157BCL7A;AKR1C3

 文章小结(Abstract):文章到此结束,纯分析发IF:4.9的文章,这篇8月见刊的文章如果再加一些下游机制验证的数据,发的会更高。傲星生物深耕分析十余载,另有完善的下游验证、机制研究服务,一对一专属服务为您排忧解难,助您轻松应对毕业和晋升!

傲星生物公众号回复“20240813”领取原文PDF