STDDEV_POP |
Déviation standard de la population |
| BigQuery |
Syntaxe
|
STDDEV_POP([DISTINCT] expression) [OVER (...)]
|
Paramètres
| Nom |
Description |
| DISTINCT |
Ce paramètre facultatif permet de spécifier que le calcul de l'écart type de la population doit être effectué uniquement sur les valeurs distinctes de l'expression. Si DISTINCT est utilisé, les valeurs dupliquées sont ignorées. |
| expression |
Ce paramètre permet de spécifier l'expression numérique (colonne ou calcul) pour laquelle vous souhaitez calculer l'écart type de la population. |
| OVER (...) |
Ce paramètre facultatif permet de définir la fenêtre d'analyse pour la fonction. Quand OVER est utilisé, STDDEV_POP agit comme une fonction de fenêtre, calculant l'écart type de la population pour chaque ligne par rapport à un ensemble de lignes défini par la clause OVER. Cette clause peut inclure des spécifications de partitionnement (PARTITION BY), d'ordonnancement (ORDER BY), et de cadrage de fenêtre (ROWS ou RANGE). Si OVER est omis, la fonction agit comme une fonction d'agrégation standard sur toutes les lignes du groupe ou de la table. |
Description
Cette fonction permet de demander l'écart type d'une population des valeurs spécifiées.
Remarques
- Écart type basé sur toute la population : Contrairement à STDDEV (ou STDDEV_SAMP), la fonction STDDEV_POP calcule l'écart type en considérant que
toutes les données disponibles représentent l'ensemble complet de la population, et non un échantillon. Cela signifie que la variance est divisée par n au lieu
de n - 1.
- Utilisation dans les cas de données exhaustives : STDDEV_POP est plus appropriée lorsque vous avez accès à tous les éléments d'un groupe ou d'une
série (exemple : toutes les ventes d'une année entière), car elle donne une mesure exacte de la dispersion, sans correction statistique.
- Option DISTINCT pour les valeurs uniques : En ajoutant l'option DISTINCT, la fonction élimine les doublons avant de procéder au calcul de l'écart
type. Cela permet d'obtenir une mesure de la dispersion uniquement sur les valeurs uniques, ce qui peut être utile dans certains cas d'analyse.
- Peut être utilisée comme fonction analytique avec OVER : Grâce à la clause OVER, STDDEV_POP peut s'appliquer à des fenêtres de données dynamiques. Elle
calcule alors l'écart type de la population dans chaque groupe, chaque partition ou chaque tranche de temps définie.
- Retourne NULL en l'absence de données valides : Si toutes les valeurs sont NULL ou si la clause WHERE filtre toutes les lignes, le résultat de la
fonction sera également NULL. Cela nécessite souvent un pré-traitement ou un test conditionnel pour éviter des erreurs d'analyse.
- Insensible à l'ordre des lignes (sauf avec ORDER BY) : Comme toutes les fonctions d'agrégation, STDDEV_POP donne le même résultat quelle que soit
l'ordre des lignes, sauf si la clause OVER(...) utilise explicitement un tri avec ORDER BY.
- Applicable uniquement à des types numériques : L'expression fournie doit être de type numérique (exemple : INT64, FLOAT64). Si vous appliquez
cette fonction sur du texte ou des dates, BigQuery renverra une erreur de type, sauf si une conversion explicite est faite.
- Utile pour mesurer la variabilité réelle : STDDEV_POP est idéale lorsqu'on cherche à connaître la variabilité réelle des valeurs dans un système
complet, par exemple pour comparer la stabilité de deux lignes de production dont toutes les mesures sont disponibles.
Dernière mise à jour : Jeudi, le 18 Juin 2020