我只有启动子序列,怎么找它的调控因子啊!(一)——PROMO数据库






我只有启动子序列,怎么找它的调控因子啊!(一)——PROMO数据库

eryun  生信果  2023-03-07 19:00:24

点击蓝字 / 关注我们

 

支持向量机递归特征消除(简称SVM-RFE)是由Guyon等人在对癌症分类时提出来的,最初只能对两类数据进行特征提取。它是一种基于Embedded方法。支持向量机广泛用于模式识别,机器学习等领域,SVM采用结构风险最小化原则,同时最小化经验误差,以此提高学习的性能。


SVM-RFE算法

SVM-RFE是一个基于SVM的最大间隔原理的序列后向选择算法。它通过模型训练样本,然后对每个特征进行得分进行排序,去掉最小特征得分的特征,然后用剩余的特征再次训练模型,进行下一次迭代,最后选出需要的特征数。 

小编最近发现已有部分研究将SVM-RFE算法应用于生信文章,如下图。这篇影响因子 > 5分简单纯生信文章。 


但是具体要如何实现呢?今天,小编以代码提供的数据为例进行说明。


代码具体包括:(文末付费后领取)

此代码需基于服务器运行,本地电脑运行大约需2-3天,因此购买代码的同学可以联系小编免费获取3天服务器试用账号

Step1:输入数据并构建SVM-RFE模型

Step2:训练svm分类器和交叉验证

Step3:计算错误率和准确率并绘图


下面是代码中附带数据逐步分析结果:


 svm-error图


svm-accuracy图


神奇吧,就是如此简单,我们用的都是入门级函数,稍微懂点R语言就能实现。


TIPS:
此代码需基于服务器运行,本地电脑运行大约需2-3天,因此购买代码的同学可以联系小编免费获取3天服务器试用账号。



特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权


代码合集

向上滑动阅览

更多生信热点及干货


付费后领取代码相关文件