FEATURE_DETAILS |
Détails de fournitures |
|---|---|
| Oracle Database SQL | Oracle 12c Release 2 (12.2) |
Syntaxe
| FEATURE_DETAILS ( [ schema . ] model [ , feature_id [ , topN ] ] [ DESC | ASC | ABS ] mining_attribute_clause ) |
| FEATURE_DETAILS ( INTO n [ , feature_id [ , topN ] ] [ DESC | ASC | ABS ] mining_attribute_clause ) OVER ( mining_analytic_clause ) |
Paramètres
| Nom | Description |
|---|---|
| schema | Ce paramètre permet d'indiquer le nom du schéma contenant le modèle de data mining à analyser. Il est facultatif si le modèle est situé dans le schéma actif. |
| model | Ce paramètre permet de spécifier le nom du modèle de data mining utilisé pour récupérer les détails sur les attributs caractéristiques (features). |
| feature_id | Ce paramètre permet de désigner un identifiant d'attribut caractéristique spécifique (feature) pour lequel on souhaite obtenir les détails. |
| topN | Ce paramètre permet de limiter le nombre de caractéristiques retournées aux N premiers résultats les plus significatifs, facilitant l'interprétation rapide. |
| DESC / ASC / ABS | Ce paramètre permet de définir l'ordre de tri des résultats, respectivement décroissant (DESC), croissant (ASC), ou selon la valeur absolue (ABS). |
| mining_attribute_clause | Ce paramètre permet de spécifier les attributs ou variables à analyser, en définissant la structure ou les valeurs à prendre en compte pour l'analyse. |
| INTO n | Ce paramètre permet d'entreposer les résultats dans un jeu de lignes de taille n lors de l'utilisation dans un contexte analytique avec OVER(...). |
| OVER (mining_analytic_clause) | Ce paramètre permet d'utiliser la fonction dans une clause analytique afin d'évaluer dynamiquement les attributs caractéristiques sur un ensemble de lignes. |
Description
Cette fonction permet de récupérer les détails d'un ou plusieurs attributs caractéristiques (features) associés à un modèle, une entité ou un processus d'analyse. Elle est utilisée pour explorer les dimensions descriptives d'un objet.
Remarques
- Utilisation en exploration de modèles d'apprentissage automatique : La fonction FEATURE_DETAILS est essentielle pour explorer le contenu interne d'un modèle d'apprentissage supervisé. Elle permet de comprendre quels attributs (features) ont le plus influencé les prédictions du modèle. Cela la rend précieuse pour des tâches comme l'interprétation de modèles, la validation métier, ou l'audit de conformité dans des domaines réglementés.
- Adaptée aux modèles basés sur Oracle Data Mining (ODM) : Cette fonction ne s'applique que si vous travaillez avec des modèles construits à l'aide de l'option Oracle Data Mining ou Oracle Machine Learning. Elle est donc dépendante de la présence d'un environnement Oracle activé pour le data mining. Il ne s'agit pas d'une fonction SQL standard, mais d'un outil puissant spécifique aux utilisateurs exploitant les capacités analytiques avancées d'Oracle.
- Contrôle granulaire via feature_id : Le paramètre feature_id permet de cibler précisément une feature pour en extraire les détails, au lieu de parcourir tout le modèle. Cela réduit le bruit d'analyse et permet de se concentrer sur un attribut spécifique, surtout lorsqu'on connaît à l'avance son importance ou qu'on souhaite comparer plusieurs modèles selon cet identifiant.
- Classement par importance grâce à DESC, ASC, et ABS : La fonction supporte plusieurs modes de tri, comme DESC (décroissant), ASC (croissant), ou ABS (valeurs absolues), qui permettent de hiérarchiser les résultats en fonction de l'impact des features. Cela est utile pour identifier les variables les plus déterminantes dans les prédictions du modèle, ou au contraire, celles qui ont une influence négligeable.
- Utilisation de topN pour limiter le volume de sortie : Le paramètre topN permet de n'afficher que les N premières features selon l'ordre choisi. Cette option facilite l'interprétation visuelle ou algorithmique des résultats, en évitant de traiter des dizaines ou centaines de variables, notamment dans des modèles avec un très grand nombre d'attributs.
- Prise en charge de contextes analytiques via OVER(...) : Grâce à la clause OVER(mining_analytic_clause), FEATURE_DETAILS peut être utilisée dans des analyses dynamiques sur des ensembles de données. On peut ainsi obtenir des résultats différents selon des partitions, des fenêtres, ou des segments, ce qui est très puissant pour analyser l'importance des features selon des sous-groupes.
- Exploitation directe dans des requêtes SQL : Contrairement à des outils d'analyse externes, cette fonction peut être utilisée directement dans des requêtes SQL Oracle. Cela permet une intégration fluide avec d'autres calculs analytiques, jointures ou agrégations dans un pipeline SQL sans avoir besoin de post-traitement externe.
- Compatible avec des modèles supervisés ou non supervisés : FEATURE_DETAILS peut être utilisée avec plusieurs types de modèles, incluant les modèles de classification, régression, ou regroupement (clustering). Elle permet par exemple d'analyser les variables explicatives d'un modèle de régression ou les centres de gravité d'un modèle d'unité d'allocation.
- Support de la clause mining_attribute_clause : Cette clause permet de spécifier les attributs concernés par l'analyse. Elle est particulièrement utile pour appliquer des filtres logiques ou sélectionner uniquement certaines colonnes d'intérêt, évitant ainsi une exploration trop générale ou inutile du modèle.
- Résultats interprétables en environnement métier : Les résultats retournés par FEATURE_DETAILS peuvent être interprétés par des analystes métier, car ils fournissent des mesures concrètes de poids, de contribution ou de score d'attribut. Cela facilite les échanges entre experts techniques et utilisateurs finaux, dans un contexte de gouvernance de la donnée ou d'aide à la décision.
- Paramètre schema pour analyser des modèles dans d'autres contextes : Le paramètre schema donne la flexibilité d'analyser des modèles situés dans d'autres schémas que celui de l'utilisateur actuel. Cela est pratique dans des environnements partagés ou mutualisés, où plusieurs modèles sont créés par différentes équipes.
- Optimisation des performances avec INTO n : L'option INTO n permet d'entreposer les résultats dans un ensemble de lignes de taille limitée. Cela permet une meilleure maîtrise des performances et de la mémoire, surtout dans des environnements de production avec de gros volumes ou des modèles très complexes contenant de nombreuses features.
Dernière mise à jour : Dimanche, le 29 Juin 2025