APPROX_PERCENTILE |
Percentile approximatif |
| Oracle Database SQL |
Oracle 12c Release 2 (12.2) ou supérieure |
Syntaxe
|
APPROX_PERCENTILE( expr [ DETERMINISTIC ] [, { 'ERROR_RATE' | 'CONFIDENCE' } ] )
WITHIN GROUP ( ORDER BY expr [ DESC | ASC ] )
|
Paramètres
| Nom |
Description |
| expr |
Ce paramètre permet d'indiquer l'expression numérique à analyser pour calculer une valeur de percentile approximatif. |
| DETERMINISTIC |
Ce paramètre permet de garantir que les mêmes données donneront les mêmes résultats à chaque exécution, en rendant l'estimation stable et reproductible. |
| 'ERROR_RATE' |
Ce paramètre permet de spécifier, sous forme de chaîne (ex. '0.01'), la marge d'erreur acceptable pour l'estimation du percentile. |
| 'CONFIDENCE' |
Ce paramètre permet d'indiquer le niveau de confiance statistique de l'estimation (exemple '0.95' pour 95 %), également sous forme de chaîne. |
Description
Cette fonction permet d'estimer une valeur de percentile (exemple 50e, 95e) dans un ensemble de données, de manière performante sur de grandes quantités de données.
Remarques
- Calcul performant de percentiles sur grandes données : Cette fonction est spécialement conçue pour estimer efficacement les valeurs de percentiles sur de
très grands ensembles de données, évitant ainsi la lenteur et la consommation excessive de ressources des méthodes exactes.
- Supporte les expressions numériques complexes : Le paramètre expr peut contenir non seulement des colonnes, mais aussi des expressions complexes, ce
qui permet une grande flexibilité dans les calculs analytiques.
- Option DETERMINISTIC pour stabilité des résultats : L'option DETERMINISTIC garantit que les résultats sont reproductibles, assurant ainsi la cohérence lors
d'exécutions répétées avec les mêmes données, ce qui est crucial pour les analyses comparatives.
- Gestion précise de la marge d'erreur via ERROR_RATE : Le paramètre 'ERROR_RATE' permet de définir la précision de l'estimation. Une marge d'erreur plus
faible augmente la précision au prix d'une consommation accrue de ressources, offrant ainsi un contrôle fin sur le compromis vitesse/précision.
- Niveau de confiance configurable : Grâce au paramètre 'CONFIDENCE', l'utilisateur peut spécifier la fiabilité statistique de l'estimation, ce qui est
utile pour des analyses nécessitant un certain seuil de confiance sur les résultats.
- Utilisation combinée avec la clause WITHIN GROUP : La clause WITHIN GROUP (ORDER BY expr) est essentielle pour définir l'ordre des données utilisées dans
le calcul du percentile, permettant un contrôle précis du comportement statistique.
- Adaptée pour les analyses en temps réel : La fonction est très utile dans les environnements où les données changent rapidement, comme les tableaux de
bord analytiques ou la surveillance, car elle fournit une estimation rapide sans bloquer les systèmes.
- Facilite les analyses distributées et parallèles : Cette fonction s'intègre bien dans les systèmes de calcul distribués, car elle peut être calculée en
parallèle sur des partitions de données, puis combinée, ce qui améliore considérablement la mise à l'échelle des traitements analytiques.
Dernière mise à jour : Dimanche, le 29 Juin 2025