deforest |
Déforestation d'une forêt aléatoire |
| ranger |
C++/R |
Syntaxe
|
deforest(object, which.trees = NULL, ...)
|
Fonction |
|
deforest(object, which.trees = NULL, warn = TRUE, ...)
|
Méthode S3 pour la classe «ranger» |
Paramètres
| Nom |
Description |
| object |
Une forêt aléatoire ajustée (par exemple, un objet ranger). |
| which.trees |
Vecteur donnant les indices des arbres à supprimer. |
| ... |
Paramètres supplémentaires (facultatifs). (Actuellement ignorés.) |
| warn |
Indique logiquement s'il faut ou non avertir les utilisateurs que certaines sorties standard d'un objet Ranger classique ne sont plus disponibles après la déforestation. La valeur par défaut est TRUE. |
Description
Cette fonction permet d'extraire ou convertir une forêt entraînée en une structure manipulable, facilitant l'inspection des arbres.
L'objectif principal de cette fonction est de permettre le post-traitement d'ensembles via la régression régularisée L2 (c'est-à-dire LASSO), comme décrit dans Friedman et
Popescu (2003). L'idée de base est d'utiliser LASSO pour post-traiter les prédictions des apprenants de base individuels d'un ensemble (c'est-à-dire les arbres de décision)
afin de produire un modèle beaucoup plus petit sans compromettre la précision, et même, dans certains cas, de l'améliorer. Friedman et Popescu (2003) décrivent les conditions
dans lesquelles les ensembles arborescents, comme les forêts aléatoires, peuvent potentiellement bénéficier d'un tel post-traitement (par exemple, en utilisant des arbres
moins profonds, entraînés sur des échantillons beaucoup plus petits de données d'entraînement sans remise). Cependant, les avantages informatiques de ce post-traitement ne
peuvent être obtenus que si les apprenants de base « mis à zéro » par LASSO peuvent être effectivement retirés de l'ensemble d'origine, d'où l'intérêt de cette fonction.
Remarque
- Cette fonction est générique et peut être étendue par d'autres packages.
Auteur
Brandon M. Greenwell
Références
- Friedman, J. et Popescu, B. (2003). Importance sampled learning ensembles, rapport technique, Université de Stanford, Département de statistique.
Exemples
- ## Exemple de déforestation d'une forêt aléatoire
- rfo <- ranger(Species ~ ., data = iris, probability = TRUE, num.trees = 100)
- dfo <- deforest(rfo, which.trees = c(1, 3, 5))
- dfo # identique à « rfo » mais avec les arbres 1, 3 et 5 supprimés
- ## Vérification de santé
- preds.rfo <- predict(rfo, data = iris, predict.all = TRUE)$predictions
- preds.dfo <- predict(dfo, data = iris, predict.all = TRUE)$predictions
- identical(preds.rfo[, , -c(1, 3, 5)], y = preds.dfo)
Dernière mise à jour : Vendredi, le 1er août 2025