Syntaxe
|
COUNT(*) [OVER (...)]
|
|
COUNT([DISTINCT] expression) [OVER (...)]
|
Paramètres
| Nom |
Description |
| * |
Ce paramètre permet de compter le nombre total de lignes dans un ensemble de données ou une partition, y compris les lignes contenant des valeurs NULL. |
| expression |
Ce paramètre permet de spécifier la colonne ou l'expression dont les valeurs non-NULL doivent être comptées. |
| DISTINCT expression |
Ce paramètre permet de compter le nombre de valeurs uniques et non-NULL dans la colonne ou l'expression spécifiée. |
| OVER (...) |
Ce paramètre facultatif permet de définir une fenêtre d'analyse pour la fonction COUNT, la transformant en une fonction de fenêtre. Cela permet de calculer le nombre de lignes sur des sous-ensembles de données (partitions) plutôt que sur l'ensemble du jeu de données. |
Description
Cette fonction permet de demander le nombre de lignes d'une entrée ou d'une expression spécifié.
Remarques
- COUNT(*) inclut les valeurs NULL : Lorsque vous utilisez COUNT(*), toutes les lignes sont comptées, y compris celles contenant des valeurs NULL. Cette forme
sert à mesurer le nombre total de lignes dans une table ou une partition, sans se soucier du contenu de chaque colonne.
- COUNT(expression) ignore les valeurs NULL : Si vous utilisez COUNT(expression) avec une colonne en paramètre, seules les lignes dont l'expression n'est
pas NULL seront prises en compte. Cela permet d'obtenir le nombre effectif de valeurs valides dans une colonne spécifique.
- COUNT(DISTINCT expression) pour les valeurs uniques : L'ajout de DISTINCT permet de compter uniquement les valeurs uniques et non NULL. C'est très utile
pour déterminer combien de valeurs différentes existent dans une colonne, sans tenir compte des doublons.
- La fonction peut être analytique avec OVER(...) : Grâce à la clause OVER(...), COUNT devient une fonction de fenêtre (ou analytique). Cela permet de
compter les lignes par sous-groupe (partition) ou de manière cumulative sur un ensemble trié, sans agréger les résultats.
- Compatible avec les clauses GROUP BY : COUNT est souvent utilisée avec GROUP BY pour compter le nombre d'occurrences dans chaque groupe de valeurs. Par
exemple, compter le nombre de clients par pays ou le nombre de produits par catégorie.
- Très performante sur de grands volumes de données : BigQuery est optimisé pour les agrégations comme COUNT, même sur de très grands ensembles de données.
Cela permet de l'utiliser pour produire des statistiques rapides, des synthèses, ou des analyses exploratoires.
- Peut être combinée avec d'autres agrégats : COUNT peut être utilisée avec d'autres fonctions comme SUM,
AVG ou MAX dans les mêmes requêtes. Elle permet alors d'avoir une vision complète du nombre de cas, en
parallèle d'indicateurs quantitatifs.
- Les résultats retournés sont de type INT64 : La fonction COUNT retourne toujours une valeur entière (INT64), même lorsque le résultat est nul. Il
est donc possible d'utiliser cette sortie dans des calculs entiers, ou de la comparer à d'autres seuils ou compteurs.
Dernière mise à jour : Jeudi, le 18 Juin 2020