CORR |
Correlation |
|---|---|
| Oracle Database SQL | Oracle 10g (10.1) ou supérieure |
Syntaxe
| corr(n,m) |
Paramètres
| Nom | Description |
|---|---|
| n | Ce paramètre permet d'indiquer la première valeur de la paire. |
| m | Ce paramètre permet d'indiquer la deuxième valeur de la paire. |
Description
Cette fonction permet de retourner le coefficient de corrélation d'un ensemble de nombre pairs.
Remarques
- Analyse statistique intégrée : Cette fonction permet d'effectuer directement des calculs statistiques dans une requête SQL, en évitant de recourir à des outils externes pour obtenir un coefficient de corrélation. Elle est utile pour explorer la dépendance linéaire entre deux séries de données numériques.
- Résultat compris entre -1 et 1 : Le résultat retourné par CORR(n, m) est une valeur flottante comprise entre -1 et 1. Une valeur proche de 1 indique une forte corrélation positive, tandis qu'une valeur proche de -1 signale une forte corrélation négative. Une valeur proche de 0 signifie une absence de corrélation linéaire.
- Supporte l'agrégation : CORR est une fonction d'agrégation : elle opère sur un ensemble de lignes, généralement dans une clause GROUP BY. Elle peut être combinée avec des fonctions analytiques pour observer la corrélation dans des fenêtres de données dynamiques.
- Gère les valeurs NULL : Lors du calcul, les paires contenant au moins une valeur NULL sont ignorées. Il est donc important de s'assurer que les colonnes utilisées dans l'appel à CORR ne contiennent pas de valeurs NULL si l'on souhaite un résultat complet.
- Utilisable dans des requêtes analytiques : Bien qu'elle soit principalement une fonction d'agrégation, CORR peut être utilisée dans un contexte analytique avec une clause OVER(...), permettant le calcul de corrélations partielles dans des partitions de données.
- Interprétation contextuelle nécessaire : Le coefficient de corrélation mesure uniquement la force de la relation linéaire. Deux variables peuvent avoir une relation non linéaire forte sans pour autant avoir une corrélation élevée. Une interprétation statistique correcte est donc nécessaire.
- Comparaison avec d'autres fonctions : Oracle propose aussi d'autres fonctions statistiques comme COVAR_POP, REGR_SLOPE, ou CORR_S, qui permettent une analyse complémentaire à celle fournie par CORR. Leur utilisation conjointe enrichit l'analyse des relations entre variables.
- Performance sur grandes tables : Sur de grands volumes de données, l'utilisation de CORR peut être coûteuse si elle est mal indexée ou combinée à des jointures complexes. Il est donc conseillé de tester les performances ou d'utiliser des vues matérialisées si les données changent peu.
Voir également
Article - Les géants de l'informatique - Oracle
Dernière mise à jour : Lundi, le 11 mai 2015