REGR_R2 |
Régression R2 |
| Oracle Database SQL |
Oracle 10g Release 1 (10.1) ou supérieure |
Syntaxe
|
REGR_R2(expr1, expr2) [ OVER (analytic_clause) ]
|
Paramètres
| Nom |
Description |
| expr1 |
Ce paramètre permet de spécifier l'expression numérique représentant la variable dépendante (y) utilisée dans le calcul du coefficient de détermination. |
| expr2 |
Ce paramètre permet de spécifier l'expression numérique représentant la variable indépendante (x) utilisée pour établir la relation linéaire avec expr1. |
| analytic_clause |
Ce paramètre permet de définir, lorsqu'il est utilisé, la clause analytique qui partitionne et ordonne les données sur lesquelles la fonction calcule le coefficient R2, sans regrouper physiquement les lignes. |
Description
Cette fonction permet de calculer le coefficient de détermination (R2) qui mesure la qualité de l'ajustement de la régression linéaire.
Remarques
- La fonction REGR_R2 est utilisée pour mesurer la qualité de l'ajustement d'un modèle de régression linéaire, en fournissant un coefficient de détermination compris
entre 0 et 1. Plus cette valeur est proche de 1, meilleure est la qualité de l'ajustement.
- Le paramètre expr1 correspond à la variable dépendante, c'est-à-dire la variable que l'on cherche à expliquer ou prédire dans la régression. Sa qualité est cruciale
pour obtenir un coefficient R2 pertinent.
- Le paramètre expr2 représente la variable indépendante, ou explicative, qui sert à prédire ou expliquer la variable dépendante. Le lien linéaire entre ces deux variables
est analysé pour calculer le coefficient R2.
- L'utilisation de la clause optionnelle OVER (analytic_clause) permet de partitionner et ordonner les données pour effectuer un calcul analytique sur des sous-ensembles
de données sans regrouper les lignes, ce qui est utile dans les analyses complexes.
- La fonction est disponible depuis Oracle 10g Release 1 (10.1), ce qui montre son ancienneté et son intégration précoce dans les capacités analytiques avancées d'Oracle.
- Le coefficient R2 calculé par REGR_R2 correspond à la proportion de la variance totale de la variable dépendante expliquée par la variable indépendante, ce qui est
une mesure classique de la qualité du modèle.
- Cette fonction ne fournit pas de valeur négative : un R2 nul indique qu'aucune relation linéaire n'est détectée, tandis qu'un R2 égal à 1 signifie un ajustement
parfait, ce qui est rarement observé en pratique.
- La fonction peut être utilisée dans des requêtes analytiques complexes, notamment lorsqu'on veut comparer la qualité de plusieurs modèles de régression sur des
sous-groupes définis par une clause analytique.
- En pratique, le calcul du coefficient R2 via REGR_R2 est souvent accompagné d'autres statistiques de régression (comme la pente, l'intercept ou l'erreur
quadratique moyenne) pour une analyse complète.
- Le paramètre expr1 et expr2 doivent être des expressions numériques, ce qui impose une certaine discipline dans la préparation des données avant d'appliquer
cette fonction.
- Cette fonction peut être combinée à d'autres fonctions analytiques d'Oracle pour réaliser des diagnostics avancés sur les modèles statistiques directement dans
une requête SQL.
- L'usage de cette fonction dans des environnements OLAP ou de data warehouse est particulièrement pertinent, car elle permet d'évaluer rapidement la pertinence des
modèles de régression sur de larges volumes de données partitionnées.
Dernière mise à jour : Dimanche, le 29 Juin 2025