Section courante

A propos

Section administrative du site

deforest

Déforestation d'une forêt aléatoire
ranger C++/R

Syntaxe

deforest(object, which.trees = NULL, ...) Fonction
deforest(object, which.trees = NULL, warn = TRUE, ...) Méthode S3 pour la classe «ranger»

Paramètres

Nom Description
object Une forêt aléatoire ajustée (par exemple, un objet ranger).
which.trees Vecteur donnant les indices des arbres à supprimer.
... Paramètres supplémentaires (facultatifs). (Actuellement ignorés.)
warn Indique logiquement s'il faut ou non avertir les utilisateurs que certaines sorties standard d'un objet Ranger classique ne sont plus disponibles après la déforestation. La valeur par défaut est TRUE.

Description

Cette fonction permet d'extraire ou convertir une forêt entraînée en une structure manipulable, facilitant l'inspection des arbres. L'objectif principal de cette fonction est de permettre le post-traitement d'ensembles via la régression régularisée L2 (c'est-à-dire LASSO), comme décrit dans Friedman et Popescu (2003). L'idée de base est d'utiliser LASSO pour post-traiter les prédictions des apprenants de base individuels d'un ensemble (c'est-à-dire les arbres de décision) afin de produire un modèle beaucoup plus petit sans compromettre la précision, et même, dans certains cas, de l'améliorer. Friedman et Popescu (2003) décrivent les conditions dans lesquelles les ensembles arborescents, comme les forêts aléatoires, peuvent potentiellement bénéficier d'un tel post-traitement (par exemple, en utilisant des arbres moins profonds, entraînés sur des échantillons beaucoup plus petits de données d'entraînement sans remise). Cependant, les avantages informatiques de ce post-traitement ne peuvent être obtenus que si les apprenants de base « mis à zéro » par LASSO peuvent être effectivement retirés de l'ensemble d'origine, d'où l'intérêt de cette fonction.

Remarque

Auteur

Brandon M. Greenwell

Références

Exemples

  1. ## Exemple de déforestation d'une forêt aléatoire
  2. rfo <- ranger(Species ~ ., data = iris, probability = TRUE, num.trees = 100)
  3. dfo <- deforest(rfo, which.trees = c(1, 3, 5))
  4. dfo # identique à « rfo » mais avec les arbres 1, 3 et 5 supprimés
  5. ## Vérification de santé
  6. preds.rfo <- predict(rfo, data = iris, predict.all = TRUE)$predictions
  7. preds.dfo <- predict(dfo, data = iris, predict.all = TRUE)$predictions
  8. identical(preds.rfo[, , -c(1, 3, 5)], y = preds.dfo)     


Dernière mise à jour : Vendredi, le 1er août 2025