Section courante

A propos

Section administrative du site

importance_pvalues

Importance de valeur-p
ranger C++/R

Syntaxe

importance_pvalues(
 x,
 method = c("janitza", "altmann"),
 num.permutations = 100,
 formula = NULL,
 data = NULL,
 ...
)

Paramètres

Nom Description
x objet ranger ou holdoutRF.
method Méthode de calcul des valeurs p. Utiliser « janitza » pour la méthode de Janitza et al. (2016) ou « altmann » pour la méthode non paramétrique d'Altmann et al. (2010).
num.permutations Nombre de permutations. Utilisé uniquement dans la méthode «Altmann».
formula Objet de classe formule ou caractère décrivant le modèle à ajuster. Utilisé uniquement dans la méthode «altmann».
data Données d'apprentissage de la classe data.frame ou matrix. Utilisées uniquement dans la méthode «altmann».
... Autres paramètres passés à ranger(). Utilisé uniquement dans la méthode « altmann ».

Description

Cette fonction permet de tester la significativité des importances des variables, en générant des valeurs p associées. Calculer l'importance des variables à l'aide des valeurs de p. Pour les données de grande dimension, la méthode rapide de Janitza et al. (2016) peut être utilisée. L'approche par permutation d'Altmann et al. (2010) est gourmande en ressources de calcul, mais peut être utilisée avec tous types de données.

Remarques

Références

Exemple

  1. ## Valeurs p de Janitza avec importance de Gini corrigée
  2. n <- 50
  3. p <- 400
  4. dat <- data.frame(y = factor(rbinom(n, 1, .5)), replicate(p, runif(n)))
  5. rf.sim <- ranger(y ~ ., dat, importance = "impurity_corrected")
  6. importance_pvalues(rf.sim, method = "janitza")
  7. ## Valeurs p de permutation
  8. ## Non exécuté :
  9. rf.iris <- ranger(Species ~ ., data = iris, importance = 'permutation')
  10. importance_pvalues(rf.iris, method = "altmann", formula = Species ~ ., data = iris)
  11. ## Fin (non exécuté)


Dernière mise à jour : Vendredi, le 1er août 2025