「付费」【代码-5】PCA结合SVM如何实现分类预测分析?看这篇就够了!






「付费」【代码-5】PCA结合SVM如何实现分类预测分析?看这篇就够了!

小果  生信果  2023-09-15 19:00:22

收录于话题

#代码

在之前我们已经介绍过PCA算法和SVM算法的理论概念,那么在这里便不再一一介绍,整体分析的目的就是使用PCA对数据进行降维,然后利用降维后的数据来构建并训练SVM模型,最后使得模型具备预测临床分析结果的功能。


首先我们介绍一下接下来的分析用到的数据集,我们用的是一种疾病患者的临床数据,共包含392个样本,先来看一下数据样例



这个数据每行对应一个样本,包含10个特征,最后一个特征group为目标特征,也就是样本的类别,包含control和case两种。


结果展示


由上图可以看出PCA降维结果较好,其中PCA1和PCA2轴可以较好的区分临床样本的两种种类。于是我们使用这两个新特征来训练SVM模型,进行进一步的分析。


我们把数据分成了case和control两组,其中包含34个case和98个control,SVM模型预测case分组有5个错误,预测control分组有1个错误,预测错误的样本非常少,这即说明利用PCA技术对数据进行降维后的特征可以很好地区分样本种类,同时说明降维后的数据来训练SVM模型具有很高的预测准确率。于此同时,为了更加直观展示其预测准确率,我们绘制了ROC曲线图,如上图所示,其显示最后利用SVM来预测样本分类准确率达到了92.1%!开放思维来想,这个方法能不能用来分析我们生信方向存在的一些多特征多分类问题呢?答案当然是可以的。怎么样,简单吧!纵观全文,整个分析思想非常直观,但细节仍然要注意哦!


分析到这里就结束啦!小伙伴们是不是感觉眼前一亮?当时小果在完成分析后也是开心了很久,想着可以要是可以给小伙伴们带来启发那真是太好了!大家也不要偷懒哦!快去动手自己尝试一下!(推荐一下小果新开发的零代码云生信分析工具平台包含超多零代码小工具,上传数据一键出图,感兴趣的小伙伴欢迎来参观哟,网址:http://www.biocloudservice.com/home.html)



如果需要完整的代码可以点击付费获取哦!今天小果的分享就到这里,如果小伙伴有其他数据分析需求,可以尝试本公司新开发的生信分析小工具云平台,季代码完成分析,非常方便奥!

云平台网址为: http://www.biocloudservice.com/home.html,包括根据gsva结果绘制绘制两基因相关性 图(http://www.biocloudservice.com/405/405.php),根 据 gsva 筛 选高相关性基因(http://www.biocloudservice.com/404/404.php)等小工具,欢迎小伙伴们来尝试哟!


(扫码领取整理好的输入文件,代码文件及示例结果