REGR_COUNT |
Compteur de régression |
| Oracle Database SQL |
Oracle 10g Release 1 (10.1) ou supérieure |
Syntaxe
|
REGR_COUNT(expr1, expr2) [ OVER (analytic_clause) ]
|
Paramètres
| Nom |
Description |
| expr1 |
Ce paramètre permet de spécifier la première expression numérique représentant une variable dans la paire de données à analyser pour la régression. |
| expr2 |
Ce paramètre permet de spécifier la deuxième expression numérique représentant l'autre variable dans la paire de données à analyser. |
| analytic_clause |
Ce paramètre permet de définir une clause analytique optionnelle pour partitionner et ordonner les données sur lesquelles le comptage des paires est effectué. |
Description
Cette fonction permet de compter le nombre de paires de données valides utilisées dans le calcul de la régression linéaire.
Remarques
- REGR_COUNT est une fonction analytique introduite dès Oracle 10g Release 1 (10.1), ce qui la rend disponible dans les versions modernes d'Oracle pour les
calculs statistiques et analytiques.
- Cette fonction compte explicitement le nombre de paires valides de données non nulles entre deux variables numériques, ce qui est crucial pour assurer la validité
des calculs de régression linéaire.
- La fonction nécessite deux expressions numériques en entrée, expr1 et expr2, représentant respectivement la variable dépendante et indépendante dans
l'analyse de régression.
- Le fait de compter uniquement les paires valides signifie que si une valeur dans expr1 ou expr2 est nulle, cette paire est exclue du comptage, assurant
ainsi la cohérence statistique.
- L'utilisation optionnelle de la clause analytique OVER (analytic_clause) permet de partitionner et d'ordonner les données, ce qui est très utile pour calculer ce
compteur dans des groupes ou partitions spécifiques sans regrouper physiquement les lignes.
- Cette fonction est fréquemment utilisée en complément d'autres fonctions de régression comme REGR_SLOPE, REGR_INTERCEPT ou REGR_R2, afin d'évaluer la quantité de
données qui contribuent à la modélisation.
- En fournissant le nombre de paires valides, REGR_COUNT aide à diagnostiquer la qualité des données d'entrée, mettant en lumière les éventuelles absences ou lacunes
dans l'ensemble de données.
- Elle est particulièrement pertinente dans des contextes de business intelligence et d'analyse prédictive où la qualité et la complétude des données sont essentielles
pour des prévisions fiables.
- En comparaison avec une simple fonction de comptage, REGR_COUNT est spécialisée pour le contexte de la régression, ce qui évite d'avoir à écrire des filtres manuels
pour exclure les données nulles.
- Cette fonction peut également être utilisée dans des requêtes analytiques pour obtenir une meilleure compréhension de la taille effective de l'échantillon analysé,
ce qui est important pour la validité statistique.
- Son intégration native dans Oracle SQL facilite l'utilisation des fonctions analytiques dans des pipelines ETL et des rapports, améliorant ainsi la fluidité et la
performance des calculs statistiques.
- Enfin, le fait que cette fonction soit intégrée directement dans Oracle permet d'éviter des traitements externes ou des calculs supplémentaires dans des langages
tiers, optimisant la performance globale des analyses.
Dernière mise à jour : Dimanche, le 29 Juin 2025