STDDEV |
Déviation standard |
|---|---|
| Oracle Database SQL | Oracle 7 ou supérieure |
Syntaxe
| stddev([ DISTINCT | ALL ] expression) |
Paramètres
| Nom | Description |
|---|---|
| expression | Ce paramètre permet d'indiquer l'expression ou la colonne où il effectue le calcul de l'écart-type. |
Description
Cette fonction statistique retourne l'écart-type d'un tableau de nombre réel.
Remarques
- Nature statistique de la fonction : La fonction STDDEV calcule l'écart-type d'un ensemble de valeurs numériques, ce qui mesure la dispersion des données autour de la moyenne. Plus l'écart-type est élevé, plus les valeurs sont dispersées ; plus il est faible, plus elles sont regroupées autour de la moyenne.
- Disponibilité dans Oracle : STDDEV est une fonction historique d'Oracle, disponible depuis Oracle 7 et dans toutes les versions ultérieures. Contrairement à certaines fonctions statistiques modernes, elle n'a pas été introduite récemment, ce qui garantit sa compatibilité avec quasiment tous les environnements Oracle encore en service.
- Paramètre expression : Le paramètre expression désigne soit une colonne numérique, soit une expression calculée. Il est important que les données soient de type numérique, car la fonction ne peut pas traiter directement des types texte ou date (sauf conversion explicite).
- Utilisation de DISTINCT : L'option DISTINCT permet de calculer l'écart-type en ne tenant compte que des valeurs uniques. Cela est utile lorsqu'on veut éliminer l'effet des doublons sur la mesure de dispersion.
- Utilisation de ALL : L'option ALL (valeur par défaut) prend en compte toutes les valeurs, y compris les doublons. C'est l'option la plus utilisée lorsque l'on veut mesurer la dispersion réelle de l'ensemble des données sans filtrage.
- Gestion des valeurs NULL : Les valeurs NULL sont ignorées dans le calcul de l'écart-type. Cependant, si toutes les valeurs d'une colonne sont nulles, le résultat renvoyé par la fonction sera NULL.
- Calcul basé sur l'échantillon : Par défaut, STDDEV calcule l'écart-type d'un échantillon et non de la population entière. Cela signifie que la formule utilisée divise par n-1 (où n est le nombre d'observations non nulles), ce qui est la méthode de l'écart-type échantillonnal.
- Différence avec STDDEV_POP : Il ne faut pas confondre STDDEV avec STDDEV_POP, introduit dans les versions plus récentes d'Oracle, qui calcule l'écart-type de la population entière (division par n). Le choix entre les deux dépend du contexte statistique.
- Importance dans l'analyse de données : L'écart-type est une mesure de variabilité essentielle dans les analyses statistiques. Dans un contexte SQL, STDDEV permet d'obtenir rapidement cette information directement sur des données en base, sans passer par un outil externe.
- Utilisation dans les analyses groupées : Combinée avec la clause GROUP BY, STDDEV permet de calculer l'écart-type pour chaque groupe défini. Par exemple, on peut mesurer la dispersion des ventes par région, ou des temps de réponse par type de requête.
- Impact des valeurs extrêmes : Comme toute mesure basée sur la moyenne, l'écart-type est sensible aux valeurs extrêmes. Quelques données très élevées ou très faibles peuvent augmenter artificiellement le résultat, ce qui doit être pris en compte lors de l'interprétation.
- Performance sur grands volumes : Le calcul de l'écart-type implique un parcours complet des données et des opérations mathématiques sur chaque valeur, ce qui peut avoir un impact sur les performances sur de très grands ensembles de données. Dans ces cas, il est parfois préférable d'optimiser les index ou de travailler sur un échantillon réduit.
Voir également
Article - Les géants de l'informatique - Oracle
Dernière mise à jour : Lundi, le 11 mai 2015