中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

小伙伴们又见面啦,今天咱们聊聊生信界的“网红”——机器学习!临床预后模型构建相信是每个搞生信的小伙伴再熟悉不过的了,而机器学习对于预后模型的构建至关重要。不仅仅是预后模型,在其他类的研究中机器学习也是举足轻重的。

今天给大家带来一篇苏州大学李艳红教授团队发表在15+柳叶刀子刊的文章Identification and validation of an explainable prediction model of acute kidney injury with prognostic implications in critically ill children: a prospective multicenter cohort study,该研究开发了11种不同的机器学习模型来预测儿童急性肾损伤(AKI),并进行了内部和外部验证。在所有ML模型中,RF模型在区分能力上表现最佳,AUC值达到0.940。而且研究将最终的预测模型转化为一个方便的在线工具,便于临床设置中使用。“机器学习”现在已经让临床预后模型变成了“精准预测的神器”。下面跟小云一起看看这篇文章吧对机器学习感兴趣,但是缺乏技术和思路的宝子,可以来找小云哟!)

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!
定制生信分析

云服务器租赁

(加微信备注99领取试用)


中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

题目:危重病儿童急性肾损伤的可解释预测模型的确定和验证:一项多中心队列研究
杂志:EClinicalMedicine
IF:15.1

发表时间:2024.1 

关注公众号,后台发送“123”可以直接获取原文PDF,文献编号:240518
研究背景

急性肾损伤(Acute kidney injury, AKI)是危重患儿常见且严重的器官功能障碍。早期识别和预测AKI具有重要意义。然而,目前的AKI标准敏感性和特异性不足,且AKI的异质性限制了AKI生物标志物的临床价值。本研究旨在基于机器学习(ML)方法建立可解释的AKI预测模型并进行验证,评估其对儿科重症监护病房(PICU)患儿AKI预后的预测价值。

研究思路

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

主要结果

模型构建以及预测结果比较

在儿童重症监护病房(PICU)入住后的第一个24小时内收集的数据被用来生成11个机器学习(ML)模型,以预测在PICU停留期间发展为急性肾损伤(AKI)的情况。在11个模型中,随机森林(RF)模型(AUC = 0.940)对AKI的预测效果最好,其次是LightGBM模型(AUC = 0.936)和GBM模型(AUC = 0.922)(图2A)。在根据特征重要性排名减少特征数量的过程中,这些模型的AUC值变化表明,RF模型在这些模型中保持了几乎最佳的预测能力,如图2B所示。因此,可以观察到,在上述五个模型中,RF模型在AKI预测方面表现最佳。RF模型在不同数量特征下的性能表现在图2C中展示。

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

模型解释

作者利用SHAP方法通过计算各变量对预测的贡献来解释最终模型的输出结果。这种可解释的方法提供了两种类型的解释:特征层面的模型全局解释和个体层面的局部解释。全局解释描述了模型的整体功能。如SHAP汇总图(图3A和图B)所示,使用平均SHAP值来评估特征对模型的贡献,并以降序显示。此外,SHAP依赖图有助于理解单个特征如何影响预测模型的输出。这8个特征的真实值与SHAP值的对比如图3C所示,SHAP值大于0对应模型中的阳性类别预测,即较高的AKI风险。    
中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

此外,局部解释分析了如何结合个体化的输入数据,对特定的个体做出一定的预测。图4A-C显示患儿在PICU期间未发生AKI。根据预测模型,图4A表示该患儿进入“AKI”类别的概率为5.6%,图4B表示该患儿进入“非AKI”类别的概率为94.4%。瀑布图中还显示了各特征的实际测量值。观察到,eGFR、PRISMⅲ评分、BUN、UO、MAP_min、APTT和体重的值推动了“非AKI”分级的决策,而TBil没有推动。如果eGFR等大多数指标的实际值正常,则发生AKI的风险较低。而TBil实际值超出正常范围可能会增加患儿发生AKI的风险,尽管总体预测将该患儿推入”非AKI “级别。

图4D-F中,在PICU住院期间发生AKI的患儿中也观察到类似现象。将决策推向“AKI”类别的特征及其实际测量值如图4D和E所示。该病例的决策倾向于“AKI”的概率为92.7%,倾向于“非AKI”的概率为7.3%。此外,内部验证队列中儿童的解读力图见图4G。

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

临床应用

最终的预测模型被实现到web应用程序中,以促进其在临床场景中的效用,如图5所示。当输入模型所需的8个特征的实际值时,该应用程序将自动预测每个儿童发生AKI的风险。此外,还将显示每个患儿的力图,以显示有助于做出AKI决策的特征:右边的蓝色特征是将预测推向“非AKI”的特征,左边的红色特征是将预测推向“AKI”的特征。这个web应用程序可以通过https://prediction-model-for-aki.streamlit.app在线访问。

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!
预后影响

为了进一步研究该可解释模型识别出的AKI对预后的影响,作者将最终模型与KDIGO标准相结合,将患儿分为亚组:亚组1 [AKI(−)/预测模型(−)]、亚组2 [AKI(−)/预测模型(+)]、亚组3 [AKI(+)/预测模型(−)]、亚组4 [AKI(+)/预测模型(+)],如图6所示。

亚组2和亚组4的儿童死亡率分别显著高于亚组1。同时,与亚组1相比,亚组2患儿PRISM III评分的疾病严重程度更高,更容易并发MODS、休克/DIC和需要机械通气。亚组4患儿的疾病严重程度评分高于亚组3患儿,更容易发生休克/DIC(图6B-C)

各亚组间临床变量分布的广泛差异见图6C。反映心血管、肝、肾功能、凝血和炎症反应的一些变量在亚组2中比亚组1更差。在亚组3和亚组4的儿童中观察到类似的差异。

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

文章小结

研究不仅开发了单一的预测模型,而是比较了11种不同的ML模型,以确定最佳的AKI预测模型。而且,将最终的预测模型转化为一个在线应用程序,使得临床医生能够方便地使用该工具进行AKI风险评估。通过全局和局部解释,SHAP方法提供了模型特征贡献的详细视图,增强了模型的透明度和可信度。这套分析你学会了吗?不会又想学习的可以直接联系小云哦~而且小云这里还有好用的服务器,可以助您事半功倍!有意愿试用咱们生信服务器的同学欢迎扫码联系!

中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!

定制生信分析

云服务器租赁

热点推荐

孟德尔随机化

临床公共数据分析

单细胞测序

肿瘤免疫与微环境

机器学习

单基因分析

生信云服务器

代码合集(点击查看)

培训班系列(点击查看)

原文始发于微信公众号(云生信学生物信息学):中国科研团队惊艳柳叶刀子刊!11种机器学习+中国儿童队列+预测模型,苏州大学李艳红团队遥遥领先!