APPROX_MEDIAN |
Médiane approximative |
| Oracle Database SQL |
Oracle 12c Release 2 (12.2) ou supérieure |
Syntaxe
|
APPROX_MEDIAN( expr [ DETERMINISTIC ] [, { 'ERROR_RATE' | 'CONFIDENCE' } ] )
|
Paramètres
| Nom |
Description |
| expr |
Ce paramètre permet d'indiquer l'expression numérique sur laquelle la médiane approximative doit être calculée. Il s'agit généralement d'un nom de colonne contenant des valeurs numériques. |
| DETERMINISTIC |
Ce paramètre permet de spécifier que l'algorithme d'estimation doit produire les mêmes résultats à chaque exécution sur les mêmes données, ce qui peut être utile pour les traitements reproductibles. |
| 'ERROR_RATE' |
Ce paramètre permet d'indiquer la marge d'erreur acceptable pour l'approximation. Il est fourni sous forme de chaîne (exemple '0.01' pour une erreur maximale de 1 %). |
| 'CONFIDENCE' |
Ce paramètre permet de définir le niveau de confiance statistique pour l'approximation, également sous forme de chaîne (exemple '0.95' pour 95 % de confiance). |
Description
Cette fonction permet de calculer une estimation rapide de la médiane sur un ensemble de valeurs numériques, avec une consommation de mémoire réduite.
Remarques
- Calcul rapide et efficace de la médiane : Cette fonction fournit une estimation de la médiane d'un ensemble de données numériques en évitant les coûts élevés
des calculs exacts. Elle est particulièrement adaptée aux très grands volumes de données où la rapidité est essentielle.
- Utilisation d'algorithmes probabilistes : APPROX_MEDIAN s'appuie sur des méthodes statistiques approximatives, comme les algorithmes de résumé de données,
pour offrir un compromis entre précision et performance.
- Paramètre DETERMINISTIC pour reproductibilité : Le paramètre optionnel DETERMINISTIC garantit que le résultat sera identique pour une même entrée lors de
plusieurs exécutions, ce qui est crucial pour la cohérence des rapports et des analyses répétées.
- Contrôle de la précision via ERROR_RATE : Le paramètre 'ERROR_RATE' permet à l'utilisateur de définir la marge d'erreur acceptable, ce qui donne la
possibilité d'ajuster le compromis entre rapidité et exactitude selon les besoins spécifiques.
- Définition du niveau de confiance avec CONFIDENCE : Avec le paramètre 'CONFIDENCE', il est possible de spécifier un niveau statistique de confiance pour
l'estimation, ce qui est important dans des contextes analytiques nécessitant une évaluation rigoureuse des résultats.
- Réduction significative de la consommation mémoire : Contrairement au calcul exact de la médiane, cette fonction limite la quantité de mémoire utilisée, ce
qui est un avantage majeur lors du traitement de larges ensembles de données.
- Appropriée pour les analyses exploratoires : La fonction est idéale pour les situations où une estimation rapide est plus utile qu'une précision absolue, par
exemple dans le data mining ou le monitoring en temps réel.
- Supporte les opérations analytiques avancées : APPROX_MEDIAN peut être utilisée en combinaison avec des clauses analytiques comme GROUP BY ou PARTITION BY,
facilitant ainsi les calculs de médianes approximatives sur des sous-ensembles de données complexes.
Dernière mise à jour : Dimanche, le 29 Juin 2025