【这图怎么画】相关性热图,这样画才好看!
点击蓝字
关注小图
热图是科研论文中一种常见的可视化手段,而在转录组研究领域,我们常常需要分析一些基因与基因之间的相关性,来判断生物样本中是否存在共表达情况,以及共表达基因模块。除了基因集之间,其他方向,比如免疫细胞群体之间相关性,样本的相关性,也常常用相关性热图的形式进行展示。总而言之,往大了说,任何表征相关性的数值都可以用相关性热图来进行绘制。
小图先带大家来看看下面这张图,这是一篇发表在 PLoS Medicine (注意不是 Plos One, 该杂志 IF = 11.048) 上的文章图,来看 22 种免疫细胞群体之间的相关性,其中红色的颜色代表正相关,蓝色代表负相关。每一格的数字代表相关系数。这是一种经常会用到的图形,不同于常规热图(参考:热图绘制)。常规热图中的每行代表一个观察值,每列代表一个样本,而小图在本次教程中,将为大家带来更高级,也更美观的相关性热图。
data:image/s3,"s3://crabby-images/c91d7/c91d732c628451df2ae2e9e0ebb82d57d3d4ab16" alt=""
话不多说,直接开始~
先看一下数据结构:
data1=read.table("score-WLD_cor.txt",sep='t',header = T)
data:image/s3,"s3://crabby-images/0a10c/0a10ca1100fe10095058c7e6d644a9823df16a37" alt=""
data2=read.table("score-WLD_P.txt",sep='t',header = T)
data:image/s3,"s3://crabby-images/d8de3/d8de3d7bb2064d22b9c67508a835118f8516c58d" alt=""
data11=data1[1:19,2:20]
data11=as.matrix(data11)
rownames(data11)=data1[,1]
data22=data[,2:17]
data22=as.matrix(data22)
rownames(data22)=data[,1]
corr=data22
p.mat=data22
data1=data[,2:17]
rownames(data1)=data[,1]
data1=as.matrix(data22)
计算相关性和P值
library(Hmisc)
res2 <- rcorr(as.matrix(data1))
result=res2
corr=result$r
p=result$P
write.table(result$r, "score-WLP_cor.txt", quote = F, sep = "t", row.names = F)
data:image/s3,"s3://crabby-images/5c0c3/5c0c3393d3654bc7fa6a7d7c0e2c35ca2649fcda" alt=""
write.table(result$P, "score-WLP_P.txt", quote = F, sep = "t", row.names = F)
data:image/s3,"s3://crabby-images/a5791/a57919e881bf70ae093fafcd8e1ee9bff1784153" alt=""
绘制相关性热图
install.packages("ggcorrplot")
library(ggplot2)
library(ggcorrplot)
ggcorrplot(cor(data22))
ggcorrplot(cor(data22),outline.color = "red",tl.srt = TRUE)
ggcorrplot(s,show.diag = TRUE,type = "lower",lab = TRUE)
ggcorrplot(s,hc.order = TRUE,p.mat=p)
corr <- cor(data22)#计算相关性矩阵
p.mat<- cor_pmat(data22)#计算相关性矩阵的P值
ggcorrplot(corr,hc.order = TRUE,p.mat=p.mat)
library(corrplot)
#设置图中字体形式为Tiime New Roman
?par
## 方法1:使用par设置参数,此参数有设备依赖,可能会报“Windows字体数据库里没有这样的字体系列”的警告信息。
m = par(no.readonly = TRUE) # 查看可修改图形参数,返回的是一个列表,family是修改字体的参数。
par(family= "Times New Roman") # 设置全局使用Times New Roman字体,英文字体分为Serif和Sans-Serif字体。Times New Roman是一种Serif字体,Arial是一种Sans-Serif字体。
par("family") # 参看par的family设置
pdf(file = "lncRNA_COR.pdf",width = 6.5,height = 6.5)
cor.plot<-corrplot(corr =corr,p.mat = p.mat,type="upper",
tl.pos="lt",tl.col="black",
insig = "label_sig", sig.level = c(.01, .05),
pch.cex=1,pch.col = "black",order = "original") # ,order参数是对数据进行排序,后面再细讲。
cor.plot<-corrplot(corr = corr,type="lower",add=TRUE,method="number",
tl.pos="n",tl.col="black",tl.cex=1.2,
col="black",diag=FALSE, cl.pos="n",pch.col = "black",
number.cex = 0.8,order = "original")
dev.off()
par(m) # 还原初始图形参数设置
##
#font_import() # 导入字体,花的时间有点长。
install.packages("corrplot")
library(corrplot)
## 方法2:pdf()保存图片时设置为Times New Roman
pdf(file = "lncRNA_sample_cor.pdf",width = 8,height = 8,family="Times")
cor.plot<-corrplot(corr =corr,p.mat = p.mat,type="upper",
tl.pos="lt",tl.col="black",
insig = "label_sig", sig.level = c(.01, .05),
pch.cex=1,pch.col = "black",order = "original") #,order参数是对数据进行排序,后面再细讲。
cor.plot<-corrplot(corr = corr,type="lower",add=TRUE,method="number",
tl.pos="n",tl.col="black",tl.cex=1.2,
col="black",diag=FALSE, cl.pos="n",pch.col = "black",
number.cex = 0.8,order = "original")
dev.off()
data:image/s3,"s3://crabby-images/e2573/e25730a57e223071346c7022af2be9a35277ce9a" alt=""
这样的热图,既能完美征服大小老板,也能瞬间让编辑和同行评议专家们的好感度蹭蹭蹭的上升几个层次。
小图鸡汤
每一张科研制图都需要精雕细琢,勤写代码,多看帮助文档,可以让我们更好更快的掌握科研制图的精要,也能让我们的工作更完美的展现出来。加油吧!
不想写代码?可以用我们的工具云生信平台在线绘制堆积柱形图。谢谢你的阅读,请期待小图的下一期分享吧!
欢迎使用:云生信平台 ( http://www.biocloudservice.com/home.html)
data:image/s3,"s3://crabby-images/bb23a/bb23ab3c13635cd1b31069c41b66b799743f24cd" alt=""
往期推荐 |
|
|
|
👇点击阅读原文进入网址