【小云解读生信图】分析报告中的Nomogram(诺莫图/列线图)你会看吗?这篇给你详细解答!






【小云解读生信图】分析报告中的Nomogram(诺莫图/列线图)你会看吗?这篇给你详细解答!

eryun  生信果  2023-12-13 19:00:45

点击蓝字 / 关注我们

列线图究竟是什么?
文献/生信分析报告中的列线图怎么看?
从图中我们可以得到哪些信息?

小云解读生信图栏目给大家讲了火山图、热图、相关性散点图、GSEA图、箱线图。

    那么今天小云就接着给大家讲讲Nomogram(诺莫图/列线图)如何解读。

    1. 列线图是什么?

    列线图(Alignment Diagram),又称诺莫图(Nomogram),在生信分析的文章中随处可见。 

    简单概括:列线图是将Logistic回归或Cox回归的结果进行可视化呈现。

    稍微复杂点说:就是通过构建多因素回归模型(例如Cox回归、Logistic回归等常用的回归模型),根据模型中各个指标(影响因素)对结局变量的贡献程度(回归系数的大小),给每个指标的每个取值水平进行评分(points),然后再将各个评分相加得到总评分(total points),最后通过总评分与临床结局事件(患病风险/生存率)发生概率之间的函数转换关系,从而计算出该患者结局事件的预测值。

    小云解说版: 列线图是根据所有预测指标回归系数的大小来制定评分标准,给每个预测指标的每个取值水平都对应一个评分;对于每个患者的多个预测指标,就可计算得到一个总分,再通过得分计算每个患者临床结局发生的概率。展示形式就是采用带有刻度的线,按照一定的比例绘制在同一平面上,用来表达预测模型中各个变量之间的相互关系。

    估计你看完上述的文字,还是看不懂,没关系,我们直接看图说话,让你1分钟学会!

    2. 列线图的解读

    下图是一张常见的列线图,主要由左列的名称以及右列对应的带有刻度的线组成:

    (1)左侧变量名称(也就是不同的预测指标):例如图中的年龄(Age)、性别(sex)等信息,每一个变量对应的线上都标注了刻度,代表了该变量的可取值范围,而线段的长度则反映了该因素对临床结局事件的贡献大小。

    (2)得分:包括单项得分(即图中的Point),表示每个变量在不同取值下所对应的单项分数;总分(即Total Point),表示所有变量取值后对应的单项分数加起来合计的总得分。

    (3)预测概率:例如图中的Risk表示患某种疾病的风险。

    假如我们有这样一个患者,70岁(point为70),男性(point为65)。

    那么他的总得分就是65+70=135分,则这个患者患这种疾病的风险就是0.845,还是比较高的,根据此预测结果,最好提前预防或者提前做好筛查。

    当然,实际文献中会涉及到的指标比这个图要多,但原理是一样的,无非就是评分项多一些。

    接着我们再来实践一下,看你有没有学会:

    根据文献中的一个列线图,假设有个患者60岁,NETs评分为1,所患肿瘤类型是结肠腺癌(COAD)。

    如下图中红色箭头所示:当age=60时,对应的points是16;当NETs评分为1,对应的points是37;当肿瘤类型(cancer type)是COAD时,对应的points是52。

    因此,我们就可以计算出总分(Total points):16 + 37+ 52= 105分。再根据上图中的蓝色箭头就可以计算出1年、3年、5年以及10年生存率。

    除了传统的只有坐标轴的列线图,还包括下列这种展示信息更加丰富的列线图。

    在经典列线图的坐标轴元素的基础上,对于连续型变量,采用直方图的形式来展示其分布,另外还可以在图上标记比较某个患者各个指标的points 以及基于模型预测的生存概率。让图片看起来更加容易解读。

    3. 列线图临床意义

    列线图能够将复杂的回归方程转化成可视化的简单图形,使预测结果更简易可读,更方便对患者病情进行评估;在临床中可用于多指标联合诊断或预测疾病风险或预后。

    过列线图,可以为每个患者提供一个精确的数字化的生存或者风险概率,可以辅助临床医生进行决策,体现了个体化医疗的思想。但是前提是必须有清晰明了的临床问题和模型构建,而且在应用于临床决策前,需要了解其性能和局限。只有这样,列线图才能更好的应用于临床。

    4.列线图的构建

    构建列线图,其实就是构建诊断或预后模型 

    (1)首先要明确想要研究的因素,其实就是确定自变量,比如基于铜死亡相关基因或者衰老相关基因进行预测

    (2)明确临床结局,通过模型对疾病进行诊断或预测患者的预后的生存期、复发风险等。

    (3)选择合适的数据,构建模型需要患者的相关指标和临床特征、生存信息,自测数据还是公共数据等。

    经过筛选,确定了用于构建模型的预测指标之后,下一步就是确定模型,最常用的就是cox等比例风险回归模型了。

    5.列线图的评价

    验证模型性能,可以用多个队列数据进行验证,所以一般需要三个数据集:训练集、内部验证集、外部验证集。

    通过验证,可以发现模型过拟合等问题,从而采取减少变量等措施来改进模型。模型构建好之后,还要进一步评估模型的性能,这个模型性能有多好,是不是可以接受,这就需要借助特定的性能指标:

    (1)区分能力(discrimination):评价一个模型正确区分发生了对应临床结局和没有发生临床结局患者的能力。用concordance index(一致性指数,CI)来表征, 其本质就是ROC曲线下面积AUC,取值范围为0.5-1.0,越接近1.0说明预测结果与实际结果的一致性越好,其中0.5~0.7为较低区分度,>0.7~0.9为中等区分度,>0.9为高区分度。

    (2)校准度(Calibration):评价一个模型预测个体发生临床结局的概率的准确性。在实际应用中,通常用校准曲线来表征。校准曲线展示了模型预测值与实际值之间的偏差,一个典型的校准曲线示例如下


      横轴表示模型预测的不同临床结局概率,纵轴表示实际观察到的患者临床结局的概率,用中位数加均值的errorbar 形式表征,并绘制了一条斜率为1的理想曲线作为参照,实际曲线越接近于理想曲线,表明校准度越好,即模型预测结果与实际结果的偏差越小,模型效果越好。校准曲线是在特定队列数据上得到的,也就是预测模型在某个队列上的体现。

    (3)临床有效性:用决策分析曲线(Decision Curve Analysis,DCA)评价模型的临床实用性,典型的DCA曲线如下。

    对于这张图来说,图中有4条曲线对应4种模型,其中2条彩色的主要的就是构建的预后模型(NETs评分),而另外两条就是辅助决策的模型,一条灰色的表示患者全部发生临床结局,另一条黑色的表示患者全部没有发生临床结局。横坐标是阈值概率,纵坐标是净收益,净收益=(真阳性比例-假阳性比例)×权重系数,权重系数是假阳性和假阴性两种临床后果的相对危害。

    通过上图可以看到,当概率小于0.15或者大于0.7时,预后模型的净收益与另外两条曲线几乎没区别,因此模型在这些区间是无助于临床决策的,即临床应用价值越低。相反区间临床应用价值越高。

    总结

    怎么样,看完小云的分析,是不是让生信小白们豁然开朗了呀?还有问题的话欢迎给小云留言或私信哦,当然也可以跟小云说,你想看哪些生信图片的解读,小云非常乐意为您提供服务!

    如果您的时间和精力有限或者缺乏相关经验,并且对复现某张生信图、生信分析和思路设计有所需要的话,“云生信”非常乐意为您提供免费思路评估、付费生信分析和定制生信思路设计等服务,欢迎咨询哦!

    扫码咨询小云

    往期推荐:


    合集

    推荐


      双疾病  

      单基因 

     铁死亡 

    肿瘤代谢

      线粒体自噬

    铜死亡

    免疫浸润

    肿瘤微环境

      代码 

    服务项目


    生信热点文献复现

    临床预后模型设计

    生信&实验方案设计

    数据库构建

    共享1T生信服务器

    35篇原创代码合集

    示例报告


    单基因在肿瘤中的生信分析

    疾病药物代谢相关基因与肿瘤免疫、预后关系探讨

    糖尿病周围神经病变铁死亡相关的基因分析

         

    我知道你在看