CORR_S |
Corrélation de Spearman |
|---|---|
| Oracle Database SQL | Oracle 18c ou supérieure |
Syntaxe
| CORR_S(expr1, expr2 [, { COEFFICIENT | ONE_SIDED_SIG | ONE_SIDED_SIG_POS | ONE_SIDED_SIG_NEG | TWO_SIDED_SIG } ] ) |
Paramètres
| Nom | Description |
|---|---|
| expr1 | Ce paramètre permet d'indiquer la première expression numérique ou ordinale à analyser pour le calcul de la corrélation de Spearman. |
| expr2 | Ce paramètre permet d'indiquer la deuxième expression numérique ou ordinale à comparer avec la première pour évaluer leur relation monotone. |
| COEFFICIENT | Ce paramètre permet de demander uniquement le calcul du coefficient de corrélation de Spearman, sans information sur la significativité statistique. |
| ONE_SIDED_SIG | Ce paramètre permet d'effectuer un test unilatéral de significativité, sans préciser de direction, sur la corrélation entre les deux expressions. |
| ONE_SIDED_SIG_POS | Ce paramètre permet de vérifier si la relation entre les deux expressions est significativement croissante à l'aide d'un test unilatéral positif. |
| ONE_SIDED_SIG_NEG | Ce paramètre permet de tester s'il existe une relation décroissante significative entre les deux expressions à l'aide d'un test unilatéral négatif. |
| TWO_SIDED_SIG | Ce paramètre permet d'exécuter un test bilatéral de significativité afin de déterminer si une corrélation significative (positive ou négative) est présente. |
Description
Cette fonction permet de calculer le coefficient de corrélation de Spearman entre deux ensembles de données, mesurant la relation monotone entre deux variables.
Remarques
- Analyse non paramétrique robuste : La fonction CORR_S repose sur le rang des valeurs plutôt que sur leurs valeurs absolues. Cela la rend robuste face aux valeurs aberrantes et aux distributions non normales, ce qui est utile dans l'analyse de données réelles peu structurées.
- Mesure de relation monotone : Contrairement à la corrélation de Pearson, mesurant la linéarité, CORR_S mesure la monotonie entre deux variables. Autrement dit, elle détecte si les valeurs augmentent ou diminuent ensemble, même de manière non linéaire.
- Utilisation en science des données : Cette fonction est précieuse dans les cas où les relations entre variables ne sont pas linéaires, mais où un lien monotone peut exister. Cela est fréquent dans les études de comportement, les analyses de tendances ou les mesures ordinales.
- Options de tests de significativité : L'ajout de paramètres tels que ONE_SIDED_SIG, ONE_SIDED_SIG_POS, ONE_SIDED_SIG_NEG et TWO_SIDED_SIG permet de tester l'importance statistique de la corrélation. Cela enrichit la fonction au-delà du simple calcul numérique.
- Support des données ordinales : CORR_S accepte des données ordinales, c'est-à-dire classées mais pas nécessairement numériques en valeurs absolues. Cela est utile lorsqu'on travaille avec des échelles (exemple : satisfaction, classement,...).
- Fonction disponible à partir d'Oracle 18c : Cette fonction a été introduite dans Oracle Database 18c, ce qui en fait une fonctionnalité relativement récente. Elle n'est pas disponible dans les versions antérieures à 18c, ce qui peut limiter son usage dans certains environnements legacy.
- Reproductibilité avec SQL pur : Comme la fonction CORR_S est intégrée dans SQL, elle permet d'être utilisée dans des requêtes purement SQL, sans nécessiter de traitement externe dans PL/SQL ou des outils statistiques tiers.
- Complémentarité avec CORR et CORR_K : CORR_S complète les fonctions CORR (Pearson) et CORR_K (Kendall) en ajoutant une troisième approche de mesure de corrélation. Cela permet aux analystes de choisir l'outil statistique le plus adapté selon la nature des données.
- Interprétation intuitive du coefficient : Le coefficient retourné par CORR_S varie entre -1 et +1, comme les autres mesures de corrélation. Une valeur proche de +1 indique une forte relation croissante, une valeur proche de -1 indique une forte relation décroissante.
- Fonction utilisée dans les analyses exploratoires : Elle est idéale pour les étapes initiales d'une analyse de données, pour détecter des relations entre variables sans présupposer de modèle mathématique. Cela en fait un outil de prédilection en data mining.
Dernière mise à jour : Dimanche, le 29 Juin 2025