IS_NAN |
Est-ce NaN |
| BigQuery |
Syntaxe
Paramètres
| Nom |
Description |
| X |
Ce paramètre permet d'indiquer l'expression à vérifier. |
Retour
| Valeur |
Description |
| FALSE |
Cette valeur indique que l'expression n'est pas un NaN. |
| TRUE |
Cette valeur indique que l'expression est un NaN.. |
| NULL |
Cette valeur indique que l'expression est une valeur nulle. |
Description
Cette fonction permet de vérifier si la valeur est une valeur non-défini (NaN).
Remarques
- La fonction IS_NAN en BigQuery est fondamentale pour identifier les valeurs "Not a Number" (NaN), qui sont des indicateurs de résultats d'opérations numériques
indéfinies ou non représentables. Ces valeurs surviennent typiquement lors de calculs comme la division de zéro par zéro (0/0) ou l'extraction de la racine carrée d'un
nombre négatif dans certains contextes. Elle est donc cruciale pour la robustesse des calculs.
- L'objectif principal de IS_NAN est de permettre une gestion proactive des données problématiques. En détectant les NaN, les utilisateurs peuvent empêcher la
propagation de ces valeurs indéfinies dans les analyses ultérieures, ce qui pourrait fausser les résultats agrégés, les modèles statistiques ou les visualisations,
assurant ainsi une meilleure intégrité des données.
- Le paramètre X de la fonction est une expression de type numérique. Cela signifie que IS_NAN peut être appliquée à une colonne, au résultat d'une fonction, ou à
toute expression qui produit une valeur numérique. Sa flexibilité permet de l'intégrer facilement dans des requêtes complexes pour valider les résultats
intermédiaires.
- La fonction retourne TRUE si l'expression X est un NaN. Cette réponse binaire simplifie grandement la logique de conditionnement dans les requêtes SQL, permettant
aux utilisateurs de filtrer rapidement les lignes contenant des valeurs NaN ou de les remplacer par des valeurs appropriées (par exemple, zéro, la moyenne, ou NULL).
- Il est essentiel de comprendre que IS_NAN retourne FALSE si l'expression X n'est pas un NaN. Cela inclut les nombres finis (comme 10, -3.14), mais aussi les valeurs
infinies (Inf ou -Inf). Par conséquent, pour une détection exhaustive des valeurs "spéciales" (non-finies ou non-numériques), il est souvent nécessaire de combiner
IS_NAN avec IS_INF.
- Comme beaucoup de fonctions BigQuery, IS_NAN gère de manière prévisible les valeurs NULL. Si le paramètre X est NULL, la fonction retourne NULL. Ce comportement
est logique puisque NULL représente une absence de valeur et ne peut être ni un nombre défini, ni un NaN, ni un infini.
- Dans un environnement de Big Data, les NaN peuvent apparaître fréquemment en raison d'erreurs de saisie, de données manquantes traitées numériquement, ou de calculs
arithmétiques complexes. La fonction IS_NAN devient alors un outil indispensable pour la qualité des données, permettant aux équipes de data engineering et d'analyse
de nettoyer et de préparer les ensembles de données pour une utilisation fiable.
- Bien que la détection des NaN soit cruciale, il est important de ne pas les confondre avec les NULL ou les infinis. Chaque type a une signification et des
implications différentes dans les calculs numériques. IS_NAN se concentre spécifiquement sur les "Not a Number", tandis que IS_NULL vérifie les valeurs manquantes
et IS_INF les valeurs infinies, chacun ayant son rôle distinct dans la validation des données.
Dernière mise à jour : Vendredi, le 8 novembre 2019