描述
临床预测模型是指使用数学模型来评估受试者当前患有某种疾病的概率或将来发生某种结局的可能性。通过该模型,利用已知特征来计算未知结局发生的概率。临床预测模型一般采用各种回归分析方法建模,回归分析的统计本质是寻找一种定量因果关系。简单地说,回归分析是评估变量X对结局Y的影响程度的定量描述。常用的方法有多元线性回归模型、Logistic回归模型和Cox回归模型。预测模型有效性的评估和验证是统计分析、数据建模和研究设计的关键。预后模型侧重于研究疾病在特定时间段内复发、死亡、伤残和并发症等结果发生的概率。这种模型在研究中非常常见,有利于找到预后相关的标记物,为临床治疗提供参考依据。
因此,本软件基于样本的生存信息,包括生存时间和生存状态,结合一组基因在各个样本中的表达值,通过多因素cox模型,采用逐步回归算法,预期找到对生存影响最大的基因组合,结合对应的回归系数构建预后模型,为后续下游分析提供参考。用户只需要输入样本的生存信息以及基因表达水平,软件将自行筛选出对生存影响最大的基因组合以及对应的回归系数,并计算得到各个样本的风险评分,同时根据风险评分中位值将样本分为高低风险组,观察两组的生存差异。
使用方法:stepmuti_Riskscore.R –surdata=
USAGE:stepmuti_Riskscore.R –surdata=<surdata>PARAMETERS:
–surdata the gene expression level in all samples and survival information for each sample ,gene as column,sample as row ,The first two columns are survival time and survival status respectively.the input csv format.
1、打开命令行界面,输入“Rscript stepmuti_Riskscore.R”调阅帮助文档,确定该程序所需的输入文件。
2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数只有1个:surdata,表示基因在各个样本中的表达水平以及样本的生存时间和状态信息,每个样本为一行,保存为以逗号分隔的csv文件,其中前两列分别为样本的生存时间和生存状态,从第三列依次往后为各个基因在样本中的表达值。
3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示”Program execution is completed“结束语。
该表格表示逐步多因素cox回归筛选的基因组合,coef表示回归系数,HR为风险比,HR.95L和HR.95H分别为95%置信区间,p.value为显著性
2. risk.txt
该表格表示最后筛选的基因组合在样本中的表达值以及每个样本通过模型分析计算出来的riskscore值。
3.forest.pdf
该图为逐步多因素cox回归筛选的基因组合对应的结果森林图
该图为风险评分在各个样本中分布以及随着风险评分上升,样本生存时间的分布散点图
该图为随着高低风险组样本的生存K–M曲线,可以看到高风险组预后更差
6.gene_pheatmap.pdf
该图为随着风险评分上升,模型中的基因表达水平变化热图
该图表示Riskscore对样本1,3,5年生存预测的ROC曲线