STDDEV_SAMP |
Déviation standard d'échantillon |
| Oracle Database SQL |
Oracle 10g Release 2 (version 10.2) ou supérieure |
Syntaxe
|
STDDEV_SAMP(expr) [ OVER (analytic_clause) ]
|
Paramètres
| Nom |
Description |
| expr |
Ce paramètre permet de spécifier l'expression numérique ou la colonne sur laquelle l'écart-type échantillonnal sera calculé. |
| analytic_clause |
Ce paramètre permet de définir une clause analytique optionnelle pour préciser la fenêtre ou la partition des données lors du calcul, comme PARTITION BY ou ORDER BY. |
Description
Cette fonction permet de calculer l'écart-type d'un échantillon extrait d'une population, en tenant compte de la correction de Bessel.
Remarques
- Nature statistique de la fonction : La fonction STDDEV_SAMP calcule l'écart-type en tenant compte que les données constituent un échantillon et non la
population entière. Elle applique la correction de Bessel, divisant par n-1 plutôt que par n, pour fournir un estimateur non biaisé de la variance.
- Disponibilité dans Oracle : Cette fonction est disponible depuis Oracle 10g Release 2 (version 10.2), qui a étendu les capacités analytiques d'Oracle en
ajoutant des fonctions permettant de distinguer les calculs basés sur la population et ceux basés sur l'échantillon.
- Paramètre expr : Le paramètre expr est l'expression numérique ou la colonne contenant les données sur lesquelles sera calculé l'écart-type
échantillonnal. La validité et la qualité des données impactent directement la pertinence du résultat.
- Usage de la clause analytique : La fonction accepte une clause optionnelle OVER (analytic_clause) permettant de calculer l'écart-type par partitions ou
fenêtres, offrant une analyse plus fine dans le cadre de groupes ou de séries temporelles.
- Paramètre analytic_clause : Ce paramètre analytique peut contenir des clauses PARTITION BY pour segmenter les données en groupes indépendants, ou ORDER BY
pour définir une séquence dans le calcul, ce qui est utile pour des analyses temporelles ou séquentielles.
- Correction de Bessel : La correction de Bessel est cruciale pour obtenir un estimateur non biaisé de la variance à partir d'un échantillon, en compensant la
sous-estimation systématique que produit le calcul sans correction.
- Différence avec STDDEV_POP : Contrairement à STDDEV_POP, qui divise par n et s'applique à une population entière, STDDEV_SAMP est conçue pour les
échantillons, ce qui est plus courant dans les études statistiques impliquant un sous-ensemble représentatif.
- Gestion des valeurs NULL : Les valeurs nulles sont ignorées dans le calcul. Si toutes les valeurs d'un groupe ou d'une partition sont nulles, la fonction
retournera NULL pour ce groupe.
- Sensibilité aux valeurs extrêmes : Comme toute mesure basée sur la moyenne, l'écart-type échantillonnal est sensible aux valeurs aberrantes, pouvant gonfler
la dispersion estimée et influencer les conclusions.
- Importance dans l'analyse statistique : STDDEV_SAMP est une fonction clé dans les analyses exploratoires et descriptives, permettant de quantifier la
variabilité et la fiabilité des données échantillonnées.
- Utilisation en combinaison avec d'autres fonctions analytiques : Elle s'intègre parfaitement avec d'autres fonctions analytiques Oracle telles que AVG(),
COUNT(), ou SUM() pour des analyses statistiques complètes directement dans SQL.
- Performance et optimisation : Le calcul de l'écart-type, surtout avec clause analytique sur de grands volumes, peut être coûteux en ressources. Il est
recommandé d'optimiser les requêtes et index pour améliorer les performances sur de grands ensembles.
Dernière mise à jour : Dimanche, le 29 Juin 2025