REGR_SYY |
Somme de régression |
| Oracle Database SQL |
Oracle 10g Release 1 (10.1) ou supérieure |
Syntaxe
|
REGR_SYY(expr1, expr2) [ OVER (analytic_clause) ]
|
Paramètres
| Nom |
Description |
| expr1 |
Ce paramètre permet de spécifier l'expression numérique représentant la variable dépendante Y dans la régression linéaire, utilisée pour mesurer ses écarts par rapport à la moyenne de Y. |
| expr2 |
Ce paramètre permet de spécifier l'expression numérique représentant la variable indépendante X dans la régression linéaire, même si elle n'intervient pas directement dans le calcul des carrés des écarts de Y, mais reste nécessaire pour définir le contexte de la régression. |
| analytic_clause |
Ce paramètre permet, lorsqu'il est utilisé, de définir une clause analytique qui partitionne et ordonne les données sur lesquelles la somme des carrés des écarts de Y est calculée, sans regrouper physiquement les lignes. |
Description
Cette fonction permet de calculer la somme des carrés des écarts des valeurs Y par rapport à leur moyenne dans la régression.
Remarques
- La fonction REGR_SYY est utilisée principalement dans un contexte de régression linéaire, où elle mesure la dispersion des valeurs Y autour de leur moyenne. Elle
calcule la somme des carrés des écarts de Y, ce qui est un indicateur clé pour évaluer la variabilité de la variable dépendante.
- Cette fonction est disponible depuis Oracle 10g Release 1 (10.1), ce qui signifie qu'elle fait partie des fonctions statistiques modernes intégrées pour faciliter
les analyses directement dans SQL, sans passer par un outil externe de calcul statistique.
- REGR_SYY prend deux arguments, mais seul le premier, expr1, est directement lié à Y (variable dépendante). Le second, expr2, est la variable X de la régression et sert
uniquement de référence dans la structure de calcul de la régression, même si la sortie ne porte que sur Y.
- Le calcul de REGR_SYY est intimement lié à la formule de variance, mais sans division par le nombre d'observations ou degrés de liberté. C'est donc une somme brute des
carrés, ce qui permet de la réutiliser dans d'autres formules statistiques.
- Lorsqu'elle est combinée avec d'autres fonctions statistiques Oracle comme REGR_SXY ou REGR_SXX, REGR_SYY permet de dériver des coefficients comme la pente et
l'ordonnée à l'origine d'une droite de régression, ainsi que le coefficient de détermination.
- La fonction supporte l'utilisation d'une clause analytique avec OVER(), ce qui permet de partitionner les données par groupe ou de définir un ordre spécifique pour
le calcul. Cela évite de devoir regrouper physiquement les données via un GROUP BY.
- Si des valeurs NULL sont présentes dans expr1 ou expr2, Oracle les ignore pour le calcul. Cela peut avoir un impact significatif si la série contient beaucoup de
valeurs manquantes, car le nombre total de paires prises en compte sera réduit.
- Contrairement à certaines fonctions statistiques, REGR_SYY n'exige pas que les données soient centrées ou normalisées au préalable, puisque le calcul intègre déjà
la soustraction de la moyenne de Y dans sa formule.
- Cette fonction est particulièrement utile dans les analyses de corrélation et de covariance, car elle permet d'obtenir directement la variabilité de Y, qui entre
dans le calcul de la corrélation linéaire (formule de Pearson).
- Dans le contexte de la régression, un REGR_SYY élevé indique une forte dispersion des valeurs Y, ce qui peut signifier que la relation linéaire avec X pourrait
expliquer seulement une partie de la variance totale.
- REGR_SYY peut être utilisé dans des modèles prédictifs internes à Oracle, notamment en combinaison avec PREDICTION ou dans des scripts PL/SQL de scoring, car il
fournit une mesure brute exploitable par des calculs plus complexes.
- Bien que REGR_SYY soit conçue pour un usage statistique, elle peut aussi servir dans des contextes non strictement liés à la régression, par exemple pour mesurer
la dispersion d'une variable dans des fenêtres temporelles, en utilisant la clause OVER(PARTITION BY ... ORDER BY ...).
Dernière mise à jour : Dimanche, le 29 Juin 2025