NET.PUBLIC_SUFFIX |
Réseau : Suffixe publique |
| BigQuery |
Syntaxe
Paramètres
| Nom |
Description |
| url |
Ce paramètre permet de spécifier la chaîne de caractères représentant l'URL dont vous souhaitez extraire le suffixe public. Le suffixe public est la partie du nom de domaine qui est sous le contrôle d'une entité de registre (par exemple, .com, .co.uk, .org). |
Description
Cette fonction permet de demander l'extension de domaine associé à un URL.
Remarques
- Extraction du suffixe public d'un nom de domaine : La fonction NET.PUBLIC_SUFFIX permet d'extraire la partie finale d'un nom de domaine, appelée suffixe
public, comme .com, .org, ou .co.uk. Ce suffixe correspond à la zone gérée par un registre officiel, distinct des sous-domaines personnalisés.
- Utilité pour l'analyse des domaines web : Cette fonction est très utile dans le cadre de l'analyse web pour classer ou regrouper des URLs par leur
extension, permettant par exemple de distinguer les sites commerciaux, gouvernementaux ou éducatifs en fonction de leur suffixe.
- Permet de normaliser les données de domaine : En extrayant systématiquement le suffixe public, il est possible de standardiser l'analyse des URLs dans
une base, ce qui facilite les opérations de tri, de filtrage, et d'agrégation sur des ensembles volumineux de données.
- Supporte les suffixes composés et multisegments : Contrairement à une simple extraction du dernier segment après un point, NET.PUBLIC_SUFFIX prend en
compte les suffixes publics complexes comme .co.uk ou .gov.fr, ce qui garantit une identification correcte du domaine de registre.
- Fonction clef pour la sécurité et la détection de phishing : Identifier le suffixe public d'un URL permet de repérer plus facilement des domaines
suspects ou des sous-domaines trompeurs, souvent utilisés dans les attaques de phishing, car le suffixe indique l'entité officiellement responsable.
- Peut être combinée avec d'autres fonctions réseau : Souvent utilisée en combinaison avec NET.HOST qui extrait l'hôte d'un URL, la fonction
NET.PUBLIC_SUFFIX affine la compréhension du domaine, facilitant les analyses sur la provenance géographique ou la catégorisation des sites.
- Retourne une chaîne de caractères : Le résultat est une chaîne de caractères représentant le suffixe public. Cela facilite son utilisation dans
des requêtes SQL classiques, notamment pour des comparaisons directes ou des regroupements avec GROUP BY.
- Ne traite que la partie nom de domaine, pas le protocole ou chemin : La fonction ignore les parties URL comme http://, https:// ou les chemins /page1.
Elle se concentre uniquement sur la portion domaine afin d'obtenir un suffixe pertinent et exploitable.
Dernière mise à jour : Jeudi, le 18 Juin 2020