REGR_SXY |
Somme de régression |
| Oracle Database SQL |
Oracle 10g Release 1 (10.1) ou supérieure |
Syntaxe
|
REGR_SXY(expr1, expr2) [ OVER (analytic_clause) ]
|
Paramètres
| Nom |
Description |
| expr1 |
Ce paramètre permet de spécifier l'expression numérique représentant la variable dépendante (Y) dans la régression linéaire, utilisée pour calculer les écarts de Y par rapport à sa moyenne. |
| expr2 |
Ce paramètre permet de spécifier l'expression numérique représentant la variable indépendante (X) dans la régression linéaire, utilisée pour calculer les écarts de X par rapport à sa moyenne. |
| analytic_clause |
Ce paramètre permet, lorsqu'il est utilisé, de définir une clause analytique qui partitionne et ordonne les données sur lesquelles la somme des produits croisés des écarts de X et Y est calculée, sans regrouper physiquement les lignes. |
Description
Cette fonction permet de calculer la somme des produits croisés des écarts de X et Y par rapport à leurs moyennes dans la régression.
Remarques
- Nature de la mesure : La fonction REGR_SXY calcule la somme des produits croisés des écarts entre X et sa moyenne et entre Y et sa moyenne. Autrement dit,
elle mesure la covariance non normalisée entre deux ensembles de données. Ce calcul est central dans les statistiques de régression linéaire, car il intervient directement
dans la détermination de la pente de la droite de régression.
- Rôle des paramètres expr1 et expr2 : Le premier paramètre (expr1) est considéré comme la variable dépendante (Y) et le second (expr2) comme la variable
indépendante (X). La fonction ne vérifie pas automatiquement la nature dépendante ou indépendante des variables : c'est au concepteur de la requête de s'assurer de leur
sens dans l'analyse.
- Lien avec la pente de régression : La valeur renvoyée par REGR_SXY est utilisée pour calculer la pente d'une droite de régression par la formule pente =
REGR_SXY / REGR_SXX. Sans cette mesure intermédiaire, il ne serait pas possible de déterminer l'orientation et l'ampleur de la relation linéaire.
- Différence avec REGR_SXX et REGR_SYY : Contrairement à REGR_SXX (qui mesure la dispersion de X) ou REGR_SYY (dispersion de Y), REGR_SXY capte la variation
conjointe des deux variables. Si REGR_SXY est positif, X et Y tendent à varier dans le même sens ; s'il est négatif, ils varient en sens inverse.
- Utilisation avec clause analytique : Grâce à l'option OVER (analytic_clause), il est possible de calculer la somme croisée des écarts pour des sous-ensembles
de données définis par un partitionnement. Cela permet d'obtenir plusieurs valeurs de covariance sur un seul jeu de résultats, sans recourir à des regroupements classiques
avec GROUP BY.
- Traitement des valeurs NULL : Comme pour les autres fonctions statistiques Oracle, les lignes où expr1 ou expr2 contiennent une valeur NULL
sont ignorées dans le calcul. Cela évite de fausser les résultats, mais réduit le nombre d'observations effectives utilisées.
- Impact de la variance nulle : Si la variable indépendante (X) a une variance nulle (toutes les valeurs identiques), REGR_SXY retournera zéro, car il n'y a
aucun écart par rapport à la moyenne à multiplier. Dans ce cas, toute relation linéaire devient indéfinie puisque la pente ne peut pas être calculée.
- Compatibilité des types de données : Les expressions fournies à expr1 et expr2 doivent être de type numérique ou implicitement convertibles en numérique. Si
elles proviennent de colonnes de type chaîne, une conversion explicite avec CAST est nécessaire pour éviter des erreurs ou conversions implicites indésirées.
- Relation avec la covariance : REGR_SXY retourne la somme non divisée par le nombre de valeurs (N), ce qui la différencie d'une covariance standard. Pour
obtenir la covariance classique, il faut diviser REGR_SXY par REGR_COUNT(expr1, expr2), qui donne le nombre de paires valides.
- Applications pratiques : En dehors des calculs de pente, cette fonction peut servir à évaluer la force et le sens de la relation entre deux variables. Par
exemple, dans un contexte économique, elle peut mesurer la variation conjointe entre le prix d'un produit et son volume de ventes.
- Performance en base de données : Étant intégrée au moteur SQL d'Oracle, REGR_SXY est optimisée pour travailler sur de grands volumes de données directement
en base. Cela évite d'exporter les données vers un outil externe de statistique, ce qui réduit le temps de traitement et les risques d'erreur.
- Disponibilité et compatibilité : Cette fonction est disponible depuis Oracle 10g Release 1 (10.1). Sa compatibilité avec les clauses analytiques la rend
utilisable aussi bien dans des rapports que dans des calculs statistiques complexes, ce qui la rend particulièrement utile dans les environnements décisionnels.
Dernière mise à jour : Dimanche, le 29 Juin 2025