干货批量处理泛癌临床相关免疫分数分析
点
击
蓝
字
★
关
注
我
们
临床相关分期是指将患者的疾病分为不同的阶段或分期,以便评估疾病的严重程度、预后以及指导治疗决策。临床相关分期在医学领域中具有重要意义,具体的分析方法和步骤可能会因研究目的、数据类型和疾病特点而有所差异。在进行肿瘤临床阶段分析时,可以根据具体的需求选择合适的统计方法和R包来进行分析,并结合临床实际进行结果解释和应用。根据分析结果,解释不同临床分期组别之间的生存差异,评估临床分期在预测患者生存率和治疗策略制定中的意义。
#if (!requireNamespace("BiocManager", quietly = TRUE))
#if (!requireNamespace("BiocManager", quietly = TRUE))
# install.packages("BiocManager")
#BiocManager::install("limma")
#install.packages("ggpubr")
options(stringsAsFactors=F)
library(limma)
library(ggpubr)
scoreFile="scores.txt" #score文件指定存储分数数据的文件名。
cliFile="clinical.txt" #临床数据文件指定存储临床数据的文件名
setwd("C:\Users\lexb4\Desktop\TMEimmune\10.cliCor")
#修改工作设置工作目录,即数据文件所在的路径。目录
#读取score文件,并对输入文件整理
rt=read.table(scoreFile,sep="t",header=T,check.names=F,row.names=1)
#读取score文件为数据框,并设置第一列作为行名。
data=as.matrix(rt)
#将数据框转换为矩阵格式。
rownames(data)=gsub("(.*?)\-(.*?)\-(.*?)\-(.*?)\-.*","\1\-\2\-\3",rownames(data))
#对行名进行处理,提取样本名称的部分信息。
data=avereps(data)
#对重复的样本进行平均处理。
#读取临床数据文件
cli=read.table(cliFile,sep="t",header=T,check.names=F,row.names=1)
#合并数据
samSample=intersect(row.names(data),row.names(cli))
data=data[samSample,]
cli=cli[samSample,]
rt=cbind(data,cli)
#找到数据和临床数据中共有的样本。根据共有的样本筛选数据和临床数据。#将数据和临床数据按列合并为一个数据框。
#临床相关性分析,输出图形结果
for(clinical in colnames(rt[,4:ncol(rt)])){
#对临床数据中的每一列进行循环。
for(score in colnames(rt[,1:3])){
#对分数数据中的每一列进行循环。
data=rt[c(score,clinical)]
#从合并的数据框中选择分数数据和当前临床数据列。
colnames(data)=c("score","clinical")
#设置数据框的列名为"score"和"clinical"。
data=data[(data[,"clinical"]!="unknow"),]
#剔除临床数据中未知的样本。
#设置比较组
group=levels(factor(data$clinical))
#提取临床数据中的分组信息。
data$clinical=factor(data$clinical, levels=group)
#将临床数据中的分组转换为因子类型,并设置分组顺序。
comp=combn(group,2)
my_comparisons=list()
for(i in 1:ncol(comp)){my_comparisons[[i]]<-comp[,i]}
#将比较组逐一添加到列表中
#绘制boxplot
boxplot=ggboxplot(data, x="clinical", y="score", color="clinical",
xlab=clinical,
ylab=score,
legend.title=clinical,
add = "jitter")+
stat_compare_means(comparisons = my_comparisons)
#输出图片
pdf(file=paste0(score,".",clinical,".pdf"),width=5.5,height=5)
#绘制箱线图并进行组间比较,最后将结果保存为PDF文件。
print(boxplot)
dev.off()
}
}
进行肿瘤临床阶段分析。读取了两个文件,一个是包含肿瘤样本的分数数据文件,另一个是包含与这些样本相关的临床数据文件。首先,代码对分数数据进行整理和处理,提取样本名称信息并去除重复的样本。然后,将分数数据和临床数据按照共有的样本进行合并,形成一个包含分数和对应临床数据的数据框。
接下来,代码通过循环遍历每个临床数据和分数数据的组合,进行临床相关性分析和图形绘制。对于每个组合,它首先筛选出有效的数据,剔除临床数据中未知的样本,并提取分组信息。然后,它根据分组信息进行组间比较,并绘制箱线图来展示分数数据在不同临床阶段之间的差异。箱线图显示了分组之间的中位数、四分位数和异常值的分布情况,而且通过添加统计标记,可以可视化地显示出不同组之间的显著性差异。
最后,代码将每个组合的箱线图保存为PDF文件,以便进一步的分析和可视化展示。
这段代码的意义在于帮助研究人员探索肿瘤临床阶段与分数数据之间的关系。通过临床相关性分析和图形展示,可以发现分数数据在不同临床阶段之间的差异,进而对肿瘤的临床特征和进展状态进行分析和解释。这对于深入理解肿瘤发展过程中的生物学特征和预后情况具有重要意义,为进一步的研究和治疗决策提供有价值的信息。有问题可以联系小师妹。
来给大家展示展示结果图吧。
下期将为你带来更多R语言的骚操作技巧,以下推荐的是一个多功能的生信平台。
云生信平台链接:http://www.biocloudservice.com/home.html。
云生信平台链接:http://www.biocloudservice.com/home.html。
★