论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!

论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
最近有宝子这样跟小云说,单细胞测序好是好就是太费钱了,小云一听就知道这是个新来的宝宝。其实,单细胞测序并不是一定要花大钱做测序的,不做实验也照样能实现,小云已经多次分享利用公共数据做单细胞分析的文章,要求不高的纯生信就可以发文毕业了,怎么操作?跟着小云往下看。
今天给大家带来的这篇文章就结合了单细胞RNA测序和bulk RNA-Seq数据,使用多种机器学习算法来识别糖尿病肾病(DN)中的新型免疫标志物。文章用到的方法如WGCNA,GO、KEGG功能富集分析,CIBERSORT算法等都是大家最熟悉不过的。最后,文章通过在大鼠模型中验证所识别的中心基因的表达水平,增强了生物信息学分析的可靠性,并为这些基因作为潜在治疗靶点提供了实验依据。想做点PCR毕业的宝子,这篇文章的思路真的再适合不过了。大数据时代,就要拿别人的数据,发自己的文章!想复现的宝宝速速扫码联系小云吧!
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
定制生信分析

云服务器租赁

(加微信备注99领取试用)

文末附原文链接,或关注公众号
后台发送“123”可以直接获取原文PDF
文献编号:240523

研究背景
越来越多的证据表明,免疫调节参与了糖尿病肾病(DN)的发病和进展。然而,免疫调节在DN中的作用尚未阐明。本研究旨在寻找DN潜在的免疫相关治疗靶点和分子机制。
数据来源
数据集
数据库
数据类型
样本信息
GSE142025
GEO
RNA-seq
9 个正常样本、6个早期 DN 样本和13个晚期 DN 样本        
GSE30528
GEO
转录组
44 个微解剖人体肾脏样本
GSE30529
GEO
转录组
12个正常和 10个DN 样本
GSE47183
GEO
转录组
14 个正常和 7 个DN样本
GSE131882
GEO
scRNA-seq
3 名健康个体和 3名DN患者
研究思路
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
研究流程图
这个流程图小云看着有点简单,想做的精美点的宝子也可以联系小云哦~
主要结果
  • 加权共表达网络的构造与关键模块的识别
基于GSE142025数据进行WGCNA分析(软阈值设置为11)(图2A)。采用分层聚类的方法,最终得到14个合格的模块(图2B)。绿松石模块(r = 0.82, P = 7e−10)和红色模块(r = 0.76, P = 9e−08)与DN晚期的正相关性更高。 
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
  • GO和KEGG通路富集分析
进一步研究了绿松石和红色模块中基因的GO和KEGG富集分析。这些基因主要富集于免疫系统过程、免疫反应和细胞活化(图3A-C)。KEGG分析结果显示,这些基因与趋化因子信号通路、细胞因子-细胞因子受体相互作用、T细胞受体信号通路有显著相关性(图3D)。
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
  • Hub基因的鉴定与验证
提取绿松石色和红色模块中的基因,将它们与GSE30528中的DEGs取交集(图4A)。鉴定出10个枢纽基因(LCK、CD48、CD3D、ITGB2、IL10RA、IL7R、CCL5、TLR7、LYZ和PTPRC)。接下来,在GSE30529和Nephroseq数据库中进行验证,结果显示这些核心基因在GSE30529和Nephroseq中的表达也高于正常样本,这与GSE30528的结果一致(图4B和C)。RT-qPCR分析正常、DN和chaga治疗组(100 mg/kg)大鼠肾脏中mRNA的表达水平。结果显示,与正常对照组相比,DN组中9个hub基因的表达水平显著上调, chaga处理组的基因表达水平几乎恢复到正常水平,这与转录组分析的结果一致(图4D)。此外,TLR7及其下游基因MyD88和NF-κB在各组中的表达趋势一致。
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
  • 建立随机森林模型(RF),支持向量机(SVM),自适应提升(AdaBoost)和KNN模型
采用RF、SVM、AdaBoost和KNN评估基于hub基因的免疫标签在DN发生发展中的诊断价值。使用GSE30528作为训练模型,GSE30529和GSE47183作为测试模型。如图5A所示,模型不确定性与所选树数的相关性呈现出一致的不准确性。进一步检验Gini系数技术,排名前4位的基因依次为LCK、CD3D、TLR7和IL7R(图5B)。如图5C和D所示,通过5折交叉验证构建了四种机器学习模型。基于交叉验证测试集数据绘制ROC曲线,可视化显示4种机器学习模型的诊断预测价值。在GSE30529和GSE47183两个验证集中,随机森林模型均表现出较高的AUC,具有更好的区分DN组和正常对照组的性能。
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
  • 基于bulk测序分析和单细胞测序分析的免疫浸润模式
在GSE142025和GSE30529中进一步进行CIBERSORT算法,探索可能参与DN发生发展的免疫细胞类型。每个样本中免疫细胞亚型的丰度示于图6A和B中。在GSE142025中(图6C),与正常样本相比,晚期DN的初始B细胞、T_cells_CD4_memory_resting、活化的NK细胞和巨噬细胞m0的比例降低,而T_cells_CD8、T_cells_CD4_naive、静止的NK细胞、巨噬细胞m2和静止的肥大细胞的比例升高。早期DN组与正常组相比,单核细胞比例降低,而T细胞γ δ比例升高。与早期DN组相比,晚期DN组T_cells_CD8、T_cells_CD4_naive、静息NK细胞、单核细胞、m2型巨噬细胞、静息肥大细胞比例较高,初始B细胞、调节性T细胞、活化的NK细胞、m0型巨噬细胞比例较低。在GSE30529(图6D)中,与正常组相比,DN组中调节性T细胞、静息NK细胞和活化的肥大细胞的比例降低,而浆细胞、γ δ T细胞、单核细胞、巨噬细胞m1、巨噬细胞m2和静息肥大细胞的比例升高。
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你! 
作者还利用单细胞测序数据集GSE131882分析了DN的免疫微环境。根据CellMarker数据库和scHCL,确定了18个细胞簇,并将这18个细胞簇注释为13个细胞群 (图7A和图7b)。每个簇中细胞的比例如图7C所示。在DN样本中检测到较高比例的免疫细胞簇(B细胞、单核细胞和自然杀伤T细胞)。使用R软件包CellChat进一步研究活化的足细胞与免疫细胞(B细胞、单核细胞和自然杀伤T细胞)之间的通讯。推测的相互作用的总体数量和细胞通信强度在DN样本中增强(图7D)。与正常样本相比,DN样本中足细胞与B细胞、单核细胞和自然杀伤T细胞的相互作用显著增强,如图7E所示。接下来,研究了DN样本和正常样本之间的不同通路,包括CD46和NOTCH信号,这些信号被报道与DN的发生发展相关(图7F)。最后,作者构建了正常和DN样本中三种免疫细胞类型和足细胞的通路图。结果表明,DN样本中足细胞与免疫细胞之间的通讯通路显著增加(图7G)。
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你! 
  • 核心基因靶向药物的预测
DGIdb共筛选出102种可能靶向核心基因的分子药物。其中靶向LCK的药物52种,靶向CD3D的药物7种,靶向ITGB2的药物19种,靶向TLR7的药物12种,靶向PTPRC的药物12种(图8)。
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!
文章小结
这篇文章整体思路很简单,作者将bulk测试和单细胞测序有机整合起来,并利用了4种机器学习来识别和验证疾病相关生物标志物。而且文章还通过简单的实验验证证实了结果的可靠性。换个疾病癌你是不是也能轻松出一篇?所以生信发文难不难,取决于你的选题,当然具备一定的生信分析能力也是必要的,这两点小云都可以帮到你,有需要随时都可以联系小云哦!
论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!

定制生信分析

云服务器租赁

热点推荐

孟德尔随机化

临床公共数据分析

单细胞测序

肿瘤免疫与微环境

机器学习

单基因分析

生信云服务器

代码合集(点击查看)

培训班系列(点击查看)

原文链接:Peng YL, Zhang Y, Pang L, Dong YF, Li MY, Liao H, Li RS. Integrated Analysis of Single-Cell RNA-Seq and Bulk RNA-Seq Combined with Multiple Machine Learning Identified a Novel Immune Signature in Diabetic Nephropathy. Diabetes Metab Syndr Obes. 2023 Jun 7;16:1669-1684. 
doi: 10.2147/DMSO.S413569.
PMID: 37312900

原文始发于微信公众号(云生信学生物信息学):论分析思路的重要性!山西医科大学李荣山团队:4种机器学习+单细胞测序+bulk RNA-Seq,非常适合只想补点PCR的你!