我们常说“一图胜千言”,今天小果就带大家学习不常见的调和曲线图。
调和曲线图用于聚类判断,
多元数据的可视化方法很多,譬如散点图、星图、雷达图、脸谱图、协同图等,大致可分为以下几类:1.基于点(如二维、三维散点图);2.基于线(如轮廓图、调和曲线图);3.基于平面图形(如星图、雷达图、蛛网图);4.基于三维曲面(如三维曲面图)。其思想是将高维数据映射到低维空间(三维以下)内,尽量使信息损失最少,同时又能利于肉眼辨识。调和曲线图和轮廓图(即平行坐标图)都是多元数据的可视化方法,它们基于“线”的形式,将多元数据表示出来,对于聚类分析有很好的帮助。
用途:
调和曲线图是D.F.Andrews 1972年提出的三角多项式作图法,所以又称为三角多项式图,其思想是把高纬度空间中的一个样品点对应于二维平面上的一条曲线:
下面是代码部分:
library(MSG)
library(RColorBrewer)
iris.col = brewer.pal(3, “Dark2”)[as.integer(iris$Species)]
par(mfrow = c(2, 2))
# 原始iris
andrews.curve(iris[, 1:4], n = 50, col = iris.col)
# 3、4列放前面
andrews.curve(iris[, c(3, 4, 2, 1)], n = 50, col = iris.col)
# 标准化后的数据
andrews.curve(scale(iris[, 1:4]), n = 50, col = iris.col)
trees数据
x = andrews.curve(scale(trees), n = 50)
离群点是哪行数据?即哪行数据对应的f(t)会大于4?
# which(apply(x>4, 1, any))
鸢尾花数据和黑莓树数据的调和曲线图:左上为原始鸢尾花数据,
右上为调整变量顺序的鸢尾花数据,左下为标准化之后的鸢尾花数据,右
下为标准化之后的黑莓树数据调和曲线图。
好了,今天的分享就到这里了,欢迎关注”生信果”、“云生信学生物信息学”、“尔云间meta分析”公众号,以及知乎、BiliBili等,我们能主要发表或收录生物信息学的教程,以及基于R的分析和可视化等内容。