我只有启动子序列,怎么找它的调控因子啊!(一)——PROMO数据库
转自公众号:云生信学生物信息学
http://mp.weixin.qq.com/s?__biz=MzAwNjE0MDY3MQ==&mid=2650751154&idx=2&sn=b9e0a4dec49b0d96fa0243028c2e0119
点击蓝字 / 关注我们
支持向量机递归特征消除(简称SVM-RFE)是由Guyon等人在对癌症分类时提出来的,最初只能对两类数据进行特征提取。它是一种基于Embedded方法。支持向量机广泛用于模式识别,机器学习等领域,SVM采用结构风险最小化原则,同时最小化经验误差,以此提高学习的性能。
SVM-RFE算法
SVM-RFE是一个基于SVM的最大间隔原理的序列后向选择算法。它通过模型训练样本,然后对每个特征进行得分进行排序,去掉最小特征得分的特征,然后用剩余的特征再次训练模型,进行下一次迭代,最后选出需要的特征数。
小编最近发现已有部分研究将SVM-RFE算法应用于生信文章,如下图。这篇影响因子 > 5分简单纯生信文章。
但是具体要如何实现呢?今天,小编以代码提供的数据为例进行说明。
代码具体包括:(文末付费后领取)
此代码需基于服务器运行,本地电脑运行大约需2-3天,因此购买代码的同学可以联系小编免费获取3天服务器试用账号。
Step1:输入数据并构建SVM-RFE模型
Step2:训练svm分类器和交叉验证
Step3:计算错误率和准确率并绘图
下面是代码中附带数据逐步分析结果:
svm-error图
svm-accuracy图
神奇吧,就是如此简单,我们用的都是入门级函数,稍微懂点R语言就能实现。
特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权
代码合集
更多生信热点及干货