PREDICTION_COST |
Coût de prédiction |
|---|---|
| Oracle Database SQL | Oracle 12c Release 1 (12.1) ou supérieure |
Syntaxe
| PREDICTION_COST ( [ schema . ] model [ , class ] cost_matrix_clause mining_attribute_clause ) |
| PREDICTION_COST ( ( OF ANOMALY | FOR expr ) [ , class ] cost_matrix_clause mining_attribute_clause ) OVER (mining_analytic_clause) |
Paramètres
| Nom | Description |
|---|---|
| schema | Ce paramètre permet de spécifier le schéma Oracle dans lequel se trouve le modèle utilisé. |
| model | Ce paramètre permet d'indiquer le nom du modèle d'apprentissage machine pour lequel on calcule le coût de prédiction. |
| class | Ce paramètre permet de spécifier la classe cible pour laquelle le coût de prédiction est évalué. |
| cost_matrix_clause | Ce paramètre permet de définir une matrice de coûts qui ajuste l'évaluation du coût selon différents types d'erreurs. |
| mining_attribute_clause | Ce paramètre permet d'indiquer les attributs ou colonnes des données utilisées comme entrée au modèle pour calculer le coût. |
| OF ANOMALY | Ce paramètre optionnel permet de demander une évaluation du coût spécifique à la détection d'anomalies. |
| FOR expr | Ce paramètre permet de désigner une expression ou valeur spécifique pour laquelle on souhaite calculer le coût de prédiction. |
| OVER (mining_analytic_clause) | Ce paramètre permet de définir la fenêtre analytique (partition, ordre,...) utilisée pour l'évaluation dans un contexte analytique. |
Description
Cette fonction permet d'évaluer le coût ou la perte associée à une prédiction dans un modèle d'apprentissage automatique.
Remarques
- Cette fonction est essentielle pour mesurer l'impact économique ou opérationnel des prédictions faites par un modèle d'apprentissage automatique, en tenant compte des coûts spécifiques liés à différentes erreurs de classification.
- Le paramètre schema permet de travailler dans un contexte multi-schémas, ce qui facilite l'organisation des modèles d'apprentissage dans des bases de données complexes et évite les conflits de noms.
- Le nom du modèle (model) est obligatoire et permet de cibler précisément la source des prédictions, ce qui est crucial pour évaluer le coût associé à différents modèles dans une même base.
- La possibilité de spécifier une classe cible rend la fonction très flexible : on peut ainsi évaluer le coût pour une catégorie spécifique, comme un segment client à risque ou un type particulier de défaut.
- La matrice de coûts (cost_matrix_clause) joue un rôle fondamental puisqu'elle définit les pénalités associées à chaque type d'erreur, permettant une analyse économique fine, par exemple en pénalisant plus fortement les faux négatifs que les faux positifs.
- Le paramètre mining_attribute_clause permet d'ajuster précisément les données d'entrée utilisées pour l'évaluation, ce qui est utile lorsque seules certaines variables impactent réellement le calcul des coûts.
- L'option OF ANOMALY permet d'adapter la fonction à la détection d'anomalies, domaine où la gestion des coûts d'erreur est particulièrement critique pour éviter des faux positifs ou faux négatifs coûteux.
- La syntaxe avec FOR expr offre la possibilité de cibler une prédiction sur une valeur ou expression précise, ce qui facilite des évaluations ciblées ou ponctuelles sur des cas spécifiques.
- L'utilisation de la clause analytique OVER (mining_analytic_clause) permet de calculer le coût dans un contexte partitionné ou ordonné, rendant la fonction compatible avec des analyses avancées en fenêtrage.
- Cette fonction aide à intégrer des considérations métier dans les processus d'apprentissage, rendant les résultats plus exploitables en conditions réelles où chaque erreur a un impact économique différent.
- Elle est particulièrement utile dans les domaines comme la finance, l'assurance ou la santé où les erreurs de prédiction peuvent avoir des coûts très variables et doivent être finement évaluées.
- Enfin, PREDICTION_COST s'inscrit dans la logique globale d'Oracle Data Mining, permettant une intégration directe dans les requêtes SQL, ce qui simplifie son usage dans des pipelines d'analyse sans nécessiter de traitements externes complexes.
Dernière mise à jour : Dimanche, le 29 Juin 2025