SPLIT |
Subdiviser |
| BigQuery |
Syntaxe
|
SPLIT(value[, delimiter])
|
Paramètres
| Nom |
Description |
| value |
Ce paramètre permet de spécifier la chaîne de caractères (STRING) ou la séquence d'octets (BYTES) que vous souhaitez diviser en sous-chaînes (ou sous-séquences d'octets). |
| delimiter |
Ce paramètre facultatif permet de définir le caractère ou la chaîne de caractères qui sera utilisé comme séparateur pour diviser la value. Si ce paramètre est omis, la fonction utilise par défaut la virgule (,) comme délimiteur pour les chaînes et ne divise pas les BYTES. Si delimiter est une chaîne vide, la fonction divise la value en un tableau de caractères individuels (pour STRING) ou d'octets individuels (pour BYTES). |
Description
Cette fonction permet de subdiviser en plusieurs sous-chaîne de caractères une chaîne de caractères en prenant pour séparateur des caractères.
Remarques
- Subdivision d'une chaîne en tableau : La fonction SPLIT retourne un tableau contenant les sous-chaînes extraites à partir de la chaîne
d'origine. Cela permet de transformer une seule cellule textuelle en plusieurs éléments exploitables individuellement.
- Séparateur personnalisable : Grâce au paramètre delimiter, il est possible de définir n'importe quel séparateur : une virgule, un espace, un
point-virgule, un mot-clef,... Cela rend la fonction très flexible pour traiter divers formats de données.
- Comportement par défaut sans séparateur : Si le paramètre delimiter est omis, la fonction utilise par défaut la virgule comme séparateur. Cela est utile
dans le cas de colonnes contenant des listes CSV simples.
- Conversion en caractères individuels : Si le delimiter est défini comme une chaîne vide (''), alors la fonction divise la chaîne caractère par
caractère. Par exemple, SPLIT('chat', '') retourne ['c', 'h', 'a', 't'].
- Compatible avec les types STRING et BYTES : La fonction SPLIT fonctionne aussi bien avec des chaînes de caractères (STRING) qu'avec des séquences
d'octets (BYTES). Cela permet de traiter du texte encodé ou des données binaires si nécessaire.
- Retourne toujours un ARRAY : Quelle que soit la configuration, SPLIT renvoie un tableau (ARRAY) contenant toutes les sous-chaînes obtenues après
découpage. Cela implique l'utilisation de fonctions complémentaires pour extraire un élément précis (comme OFFSET, ORDINAL,...).
- Utilité dans la normalisation de données : Cette fonction est très utile pour nettoyer et normaliser des colonnes contenant des données concaténées (par
exemple, des balises, des listes de mots-clefs ou des noms complets).
- Gestion des séparateurs absents : Si le séparateur spécifié n'est pas trouvé dans la chaîne d'origine, la fonction renvoie un tableau ne contenant qu'un
seul élément, à savoir la chaîne d'origine non modifiée.
Dernière mise à jour : Jeudi, le 18 Juin 2020