Langage de programmation - C++ - ranger - Référence des méthodes et fonctions

deforest	Déforestation d'une forêt aléatoire
ranger	C++/R

Syntaxe

deforest(object, which.trees = NULL, ...)	Fonction
deforest(object, which.trees = NULL, warn = TRUE, ...)	Méthode S3 pour la classe «ranger»

Paramètres

Nom	Description
object	Une forêt aléatoire ajustée (par exemple, un objet ranger).
which.trees	Vecteur donnant les indices des arbres à supprimer.
...	Paramètres supplémentaires (facultatifs). (Actuellement ignorés.)
warn	Indique logiquement s'il faut ou non avertir les utilisateurs que certaines sorties standard d'un objet Ranger classique ne sont plus disponibles après la déforestation. La valeur par défaut est TRUE.

Description

Cette fonction permet d'extraire ou convertir une forêt entraînée en une structure manipulable, facilitant l'inspection des arbres. L'objectif principal de cette fonction est de permettre le post-traitement d'ensembles via la régression régularisée L2 (c'est-à-dire LASSO), comme décrit dans Friedman et Popescu (2003). L'idée de base est d'utiliser LASSO pour post-traiter les prédictions des apprenants de base individuels d'un ensemble (c'est-à-dire les arbres de décision) afin de produire un modèle beaucoup plus petit sans compromettre la précision, et même, dans certains cas, de l'améliorer. Friedman et Popescu (2003) décrivent les conditions dans lesquelles les ensembles arborescents, comme les forêts aléatoires, peuvent potentiellement bénéficier d'un tel post-traitement (par exemple, en utilisant des arbres moins profonds, entraînés sur des échantillons beaucoup plus petits de données d'entraînement sans remise). Cependant, les avantages informatiques de ce post-traitement ne peuvent être obtenus que si les apprenants de base « mis à zéro » par LASSO peuvent être effectivement retirés de l'ensemble d'origine, d'où l'intérêt de cette fonction.

Remarque

Cette fonction est générique et peut être étendue par d'autres packages.

Auteur

Brandon M. Greenwell

Références

Friedman, J. et Popescu, B. (2003). Importance sampled learning ensembles, rapport technique, Université de Stanford, Département de statistique.

Exemples


## Exemple de déforestation d'une forêt aléatoire

rfo <- ranger(Species ~ ., data = iris, probability = TRUE, num.trees = 100)

dfo <- deforest(rfo, which.trees = c(1, 3, 5))

dfo # identique à « rfo » mais avec les arbres 1, 3 et 5 supprimés

## Vérification de santé

preds.rfo <- predict(rfo, data = iris, predict.all = TRUE)$predictions

preds.dfo <- predict(dfo, data = iris, predict.all = TRUE)$predictions

identical(preds.rfo[, , -c(1, 3, 5)], y = preds.dfo)

Dernière mise à jour : Vendredi, le 1er août 2025

Section courante

A propos

Section administrative du site

deforest