CORR_K |
Corrélation de Kendall |
|---|---|
| Oracle Database SQL | Oracle 18c ou supérieure |
Syntaxe
| CORR_K(expr1, expr2 [, { COEFFICIENT | ONE_SIDED_SIG | ONE_SIDED_SIG_POS | ONE_SIDED_SIG_NEG | TWO_SIDED_SIG } ] ) |
Paramètres
| Nom | Description |
|---|---|
| expr1 | Ce paramètre permet d'indiquer la première expression numérique ou ordinale à analyser pour le calcul de la corrélation de Kendall. |
| expr2 | Ce paramètre permet d'indiquer la deuxième expression numérique ou ordinale à comparer avec la première pour établir la relation statistique. |
| COEFFICIENT | Ce paramètre permet de spécifier que la fonction doit retourner uniquement le coefficient de corrélation de Kendall, sans information sur la signification. |
| ONE_SIDED_SIG | Ce paramètre permet de demander un test de significativité unilatéral (sans direction précisée) sur la corrélation entre les deux ensembles de données. |
| ONE_SIDED_SIG_POS | Ce paramètre permet d'effectuer un test unilatéral positif, c'est-à-dire pour tester si une relation croissante significative existe. |
| ONE_SIDED_SIG_NEG | Ce paramètre permet d'effectuer un test unilatéral négatif, c'est-à-dire pour tester s'il existe une relation décroissante significative. |
| TWO_SIDED_SIG | Ce paramètre permet de lancer un test bilatéral afin d'évaluer s'il existe une corrélation significative dans un sens ou l'autre entre les données. |
Description
Cette fonction permet de calculer le coefficient de corrélation de Kendall entre deux ensembles de données, évaluant la force et la direction de l'association entre deux variables ordinales.
Remarques
- Analyse non paramétrique des relations ordinales : La fonction CORR_K est conçue pour évaluer la relation entre deux variables ordinales ou numériques, sans supposer de distribution normale. Cela la rend particulièrement adaptée aux analyses de données où les prérequis de linéarité ou de normalité ne sont pas satisfaits.
- Différente des corrélations de Pearson ou Spearman : Contrairement à CORR (corrélation de Pearson) mesurant une dépendance linéaire, ou CORR_S (Spearman) mesurant une dépendance monotone, CORR_K évalue la concordance et la discordance des paires de données, ce qui en fait une mesure robuste face aux valeurs aberrantes et aux distributions asymétriques.
- Résultat borné entre -1 et 1 : Le coefficient retourné par défaut (si COEFFICIENT est spécifié ou implicite) varie de -1 à 1, où -1 signifie une discordance parfaite, 0 une absence d'association, et 1 une concordance parfaite. Ce comportement permet une interprétation directe de la force de l'association.
- Prise en charge des tests de significativité intégrés : Avec les options telles que ONE_SIDED_SIG ou TWO_SIDED_SIG, Oracle permet de vérifier la significativité statistique de la corrélation sans avoir à passer par un outil externe. Cela facilite l'intégration des résultats dans des chaînes de traitements SQL complexes.
- Approche orientée analytique : CORR_K est généralement utilisée dans des contextes de requêtes analytiques ou de modélisation statistique, notamment dans les domaines de la science des données, du pointage ou d'apprentissage machine embarqué dans Oracle.
- Support des expressions complexes : Les deux paramètres expr1 et expr2 peuvent être des expressions calculées, pas seulement des colonnes simples. Cela permet de réaliser des analyses croisées ou conditionnelles directement dans la requête.
- Disponible à partir d'Oracle 18c : Cette fonction est relativement récente dans l'écosystème Oracle SQL, introduite à partir de la version 18c. Elle est disponible dans toutes les versions modernes (jusqu'à 23c), mais non rétrocompatible avec les versions 12c ou antérieures.
- Performances optimisées sur grands ensembles de données : Bien que l'algorithme de Kendall soit plus complexe que celui de Pearson, Oracle a intégré une optimisation native permettant un calcul efficace même sur de grands volumes de données, surtout en usage analytique avec partitionnement (PARTITION BY).
Dernière mise à jour : Dimanche, le 29 Juin 2025