Langage de programmation - C++ - ranger - Référence des méthodes et fonctions

predict.ranger.forest	Intervalle de prédiction de forêt
ranger	C++/R

Syntaxe

## Méthode S3 pour la classe «ranger.forest»
predict(
object,
data,
predict.all = FALSE,
num.trees = object$num.trees,
type = "response",
se.method = "infjack",
seed = NULL,
num.threads = NULL,
verbose = TRUE,
inbag.counts = NULL,
...
)

Paramètres

Nom	Description
object	Ranger ranger.objet forêt.
data	Nouvelles données de test de classe data.frame ou gwaa.data (GenABEL).
predict.all	Renvoie des prédictions individuelles pour chaque arbre plutôt que des prédictions agrégées pour tous les arbres. Renvoie une matrice (échantillon x arbre) pour la classification et la régression, un tableau 3D pour l'estimation des probabilités (échantillon x classe x arbre) et la survie (échantillon x temps x arbre).
num.trees	Nombre d'arbres utilisés pour la prédiction. Les premiers arbres de la forêt sont utilisés.
type	Type de prédiction : «response», «se», «terminalNodes», «quantiles», avec «response» par défaut.
se.method	Méthode de calcul des erreurs standard. L'une des options suivantes : « jack » et « infjack » avec la valeur par défaut « inf-jack ». Applicable uniquement si type = « se ».
seed	Graine aléatoire. La valeur par défaut est NULL, ce qui génère la graine à partir de R. Définissez-la sur 0 pour ignorer la graine R. La graine est utilisée en cas d'égalité en mode classification.
num.threads	Nombre de processus légers. Utilisez 0 pour tous les cours disponibles. La valeur par défaut est 2 si elle n'est pas définie par les options/variables d'environnement.
verbose	Sortie détaillé activée ou désactivée.
inbag.counts	Nombre de fois où les observations sont dans le sac dans les arbres.
...	D'autres paramètres passés vers ou depuis d'autres méthodes.

Description

Cette méthode permet de prédire les sorties à partir d'une structure de forêt extraite, plutôt qu'un objet complet ranger.

Remarques

Pour type = 'response' (valeur par défaut), les classes prédites (classification), les valeurs numériques prédites (régression), les probabilités prédites (estimation des probabilités) ou les probabilités de survie (survie) sont renvoyées. Pour type = 'se', l'erreur type des prédictions est renvoyée (régression uniquement). Le jackknife après bootstrap ou jackknife infinitésimal pour le bagging est utilisé pour estimer les erreurs types à partir des prédictions out-of-bag. Voir Wager et al. (2014) pour plus de détails. Pour type = 'terminalNodes', les identifiants du noeud terminal de chaque arbre pour chaque observation de l'ensemble de données donné sont renvoyés.
Si type = 'se' est sélectionné, la méthode d'estimation des variances peut être choisie avec se.method. Définissez se.method = 'jack' pour le jackknife après bootstrap et se.method = 'infjack' pour le jackknife infinitésimal pour le bagging.
Pour la classification et predict.all = TRUE, les niveaux de facteurs sont renvoyés sous forme numérique. Pour récupérer les niveaux de facteurs correspondants, utilisez rf$forest$levels, si rf est l'objet ranger.
Par défaut, ranger utilise deux processus légers. La valeur par défaut peut être modifiée avec : (1) num.threads dans l'appel ranger/predict, (2) la variable d'environnement R_RANGER_NUM_THREADS, (3) options(ranger.num.threads = N), (4) options(Ncpus = N), avec priorité dans cet ordre.

Valeur

Objet de la classe ranger.prediction avec les éléments suivants :

Nom	Description
predictions	Classes/valeurs prédites (uniquement pour la classification et la régression)
unique.death.times	Heures de décès uniques (uniquement pour la survie)
chf	Fonction de risque cumulé estimée pour chaque échantillon (uniquement pour la survie).
survival	Fonction de survie estimée pour chaque échantillon (uniquement pour la survie).
num.trees	Nombre d'arbres.
num.independent.variables	Nombre de variables indépendantes.
treetype	Type de forêt/arbre. Classification, régression ou survie.
num.samples	Nombre d'échantillons.

Références

Wright, M. N. et Ziegler, A. (2017). ranger : Une implémentation rapide de forêts aléatoires pour les données de grande dimension en C++ et R. J Stat Softw 77:1-17. doi:10.18637/jss.v077.i01.
Wager, S., Hastie T. et Efron, B. (2014). Intervalles de confiance pour les forêts aléatoires : le Jackknife et le Jackknife infinitésimal. J Mach Learn Res 15:1625-1651.

Dernière mise à jour : Vendredi, le 1er août 2025

Section courante

A propos

Section administrative du site

predict.ranger.forest