sparsePC.spikeslab(spikeslab)
sparsePC.spikeslab()所属R语言包:spikeslab
Multiclass Prediction using Spike and Slab Regression
多类使用钉,板回归预测
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Variable selection for the multiclass gene prediction problem.
多类基因预测的变量选择问题。
用法----------Usage----------
sparsePC.spikeslab(x = NULL, y = NULL, n.rep = 10,
n.iter1 = 150, n.iter2 = 100, n.prcmp = 5, max.genes = 100,
ntree = 1000, nodesize = 1, verbose = TRUE, ...)
参数----------Arguments----------
参数:x
x matrix of gene expressions.
X矩阵的基因表达。
参数:y
Class labels.
类的标签。
参数:n.rep
Number of Monte Carlo replicates.
蒙地卡罗重复数。
参数:n.iter1
Number of burn-in Gibbs sampled values (i.e., discarded values).
燃烧的吉布斯采样值(即丢弃的值)。
参数:n.iter2
Number of Gibbs sampled values, following burn-in.
数吉布斯采样值,烧伤后的。
参数:n.prcmp
Number of principal components.
的主成分个数。
参数:max.genes
Maximum number of genes in final model.
在最终模型的最大数量的基因。
参数:ntree
Number of trees used by random forests.
使用随机森林的树木数。
参数:nodesize
Nodesize of trees.
Nodesize的树木。
参数:verbose
If TRUE, verbose output is sent to the terminal.
如果是TRUE,详细的输出发送到终端。
参数:...
Further arguments passed to or from other methods.
进一步的参数传递给其他方法。
Details
详细信息----------Details----------
Multiclass prediction using a hybrid combination of spike and slab linear regression and random forest multiclass prediction (Ishwaran and Rao, 2009). A pseudo y-vector of response values is calculated using each of the top n.prcmp principal components of the x-gene expression matrix. The generalized elastic net obtained from using spike and slab regression is used to select genes; one regression fit is used for each of the pseduo y-response vectors. The final combined set of genes are passed to random forests and used to construct a multiclass forest predictor. This procedure is repeated n.rep times with each Monte Carlo replicate based on balanced cross-validation with 2/3rds of the data used for training and 1/3rd used for testing.
多类的预测,使用杂交组合的穗和板坯线性回归和随机森林的多类的预测(Ishwaran和Rao,2009)。是使用每个顶端n.prcmp主成分的x-基因表达矩阵计算的响应值的矢量的伪γ-。广义弹性网使用尖峰和板坯回归获得用于选择基因;一个回归拟合用于每个的pseduoγ-响应矢量。最终结合的基因组通过随机森林和用于构建多类型森林的预测。重复这个过程,n.rep时间与每个蒙特卡洛平衡交叉验证2/3rds的用于训练的数据复制的基础上,除了1/3rd用于测试。
—> Miscellanea:
- >杂记:
Test set error is only computed when n.rep is larger than 1. If n.rep=1 the full data is used without any cross-validation.
当n.rep是大于1的,只计算测试集的错误。如果n.rep = 1,完整的数据没有任何交叉验证。
值----------Value----------
Invisibly, the final set of selected genes as well as the complete set of genes selected over the n.rep Monte Carlo replications. The random forest classifier is also returned.
不可见的,最后一组选定的基因,以及完整的基因组选择在n.rep蒙地卡罗复制。随机森林分类也被返回。
The misclassification error rate, error rate for each class, and other summary information are output to the terminal.
的误分率,为每个类的错误率,和其他的摘要信息输出到终端。
(作者)----------Author(s)----------
Hemant Ishwaran (<a href="mailto:hemant.ishwaran@gmail.com">hemant.ishwaran@gmail.com</a>)
J. Sunil Rao (<a href="mailto:rao.jsunil@gmail.com">rao.jsunil@gmail.com</a>)
Udaya B. Kogalur (<a href="mailto:kogalurshear@gmail.com">kogalurshear@gmail.com</a>)
参考文献----------References----------
Ishwaran H. and Rao J.S. (2009). Generalized ridge regression: geometry and computational solutions when p is larger than n.
参见----------See Also----------
spikeslab.
spikeslab。
实例----------Examples----------
## Not run: [#不运行:]
#------------------------------------------------------------[-------------------------------------------------- ----------]
# Example 1: leukemia data[例1:白血病数据]
#------------------------------------------------------------[-------------------------------------------------- ----------]
data(leukemia, package = "spikeslab")
sparsePC.out <- sparsePC(x = leukemia[, -1], y = leukemia[, 1], n.rep = 3)
rf.obj <- sparsePC.out$rf.obj
varImpPlot(rf.obj)
## End(Not run)[#(不执行)]
转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。
注:
注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。
注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。
注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。
|