STATS_T_TEST_INDEP |
Statistique : Test indépendant |
| Oracle Database SQL |
Oracle 10g Release 2 (10.2) ou supérieure |
Syntaxe
|
STATS_T_TEST_INDEP ( expr1, expr2 [, { { 'STATISTIC' | 'ONE_SIDED_SIG' } , expr3 | 'TWO_SIDED_SIG' | 'DF' } ] )
|
Paramètres
| Nom |
Description |
| expr1 |
Ce paramètre permet d'indiquer la première série de données numériques représentant le premier échantillon indépendant. |
| expr2 |
Ce paramètre permet d'indiquer la seconde série de données numériques représentant le second échantillon indépendant à comparer. |
| option |
Ce paramètre optionnel permet de spécifier le type de résultat à retourner par la fonction. Il peut prendre les valeurs suivantes : 'STATISTIC' (valeur de la statistique t), 'ONE_SIDED_SIG' (p-valeur pour un test unilatéral), 'TWO_SIDED_SIG' (p-valeur pour un test bilatéral) ou 'DF' (degrés de liberté du test). |
| expr3 |
Ce paramètre optionnel est utilisé avec certaines options (notamment 'ONE_SIDED_SIG') pour fournir une valeur supplémentaire nécessaire au calcul, comme un seuil ou hypothèse complémentaire. |
Description
Cette fonction permet de réaliser un test t pour deux échantillons indépendants afin de comparer leurs moyennes.
Remarques
- Sur la nature statistique de la fonction : La fonction STATS_T_TEST_INDEP met en ouvre un test t de Student pour échantillons indépendants, étant une
méthode statistique couramment utilisée pour déterminer si deux ensembles de données numériques présentent une différence significative de moyenne. Ce test part de
l'hypothèse nulle selon laquelle les deux populations d'origine ont la même moyenne et vérifie si l'écart observé est suffisamment grand pour la rejeter.
- Utilité dans le contexte des bases de données : Dans un environnement Oracle, cette fonction permet de réaliser directement des analyses statistiques sans
devoir exporter les données vers un logiciel externe comme R, Python ou
Excel. Cela optimise le temps d'exécution et réduit les risques d'erreurs liées au transfert ou au prétraitement des données.
- Compatibilité et disponibilité : Elle est disponible à partir d'Oracle 10g Release 2 (10.2), ce qui signifie qu'elle n'est pas accessible dans les
versions antérieures. Cela peut limiter son usage dans les systèmes encore basés sur des versions plus anciennes d'Oracle, obligeant dans ces cas à recourir à des
requêtes manuelles ou à d'autres méthodes statistiques externes.
- Rôle du paramètre expr1 : Le paramètre expr1 désigne la première série de données numériques constituant le premier échantillon. Il est crucial
que les valeurs soient numériques et dépourvues d'erreurs ou de valeurs aberrantes extrêmes non traitées, car elles peuvent fausser le résultat statistique.
- Rôle du paramètre expr2 : Le paramètre expr2 correspond au second échantillon, devant être indépendant du premier. Cela signifie que les
observations d'expr2 ne doivent pas avoir de relation directe ou de dépendance avec celles d'expr1, sous peine de violer les hypothèses fondamentales du test t
indépendant.
- Signification de l'argument option : Le paramètre option permet de préciser la nature du résultat attendu. L'option 'STATISTIC' retourne uniquement la
valeur t calculée, tandis que 'ONE_SIDED_SIG' ou 'TWO_SIDED_SIG' fournissent respectivement les p-valeurs pour un test unilatéral ou bilatéral. Enfin, 'DF' renvoie les
degrés de liberté, utiles pour comprendre le contexte de la distribution t.
- Spécificité de le paramètre expr3 : Le paramètre expr3 est requis dans certains cas, notamment pour fournir un seuil ou une hypothèse
complémentaire lorsque l'option sélectionnée l'exige. Une mauvaise configuration de ce paramètre peut entraîner des résultats erronés ou la non-exécution de la fonction.
- Hypothèses statistiques à respecter : Comme tout test t pour échantillons indépendants, cette fonction suppose que les deux populations suivent une
distribution normale et que leurs variances sont homogènes (ou que la méthode utilisée est adaptée aux variances inégales). Une violation de ces hypothèses peut rendre
les résultats moins fiables.
- Test unilatéral vs bilatéral : L'option 'ONE_SIDED_SIG' permet de vérifier si la moyenne d'un échantillon est strictement supérieure ou inférieure à
celle de l'autre, tandis que 'TWO_SIDED_SIG' examine si les moyennes sont différentes dans un sens ou dans l'autre. Le choix doit être guidé par la question de
recherche initiale.
- Intérêt de l'option 'DF' : Obtenir les degrés de liberté avec 'DF' est utile pour documenter et reproduire les calculs, car cette valeur dépend des tailles
d'échantillon et des variances. Les statisticiens s'en servent pour vérifier la cohérence de l'analyse et comparer les résultats avec d'autres outils.
- Impact des valeurs manquantes : Si des valeurs NULL sont présentes dans les données, elles peuvent être ignorées ou perturber le calcul selon la façon dont
la requête est écrite. Il est donc recommandé de filtrer ou de traiter ces valeurs avant de passer les paramètres à la fonction.
- Domaines d'application : Cette fonction est particulièrement pertinente pour des analyses telles que la comparaison de performances entre deux groupes
d'utilisateurs, l'évaluation de résultats avant/après une intervention (si les échantillons sont indépendants) ou l'analyse de données expérimentales réparties en deux
groupes distincts.
Dernière mise à jour : Dimanche, le 29 Juin 2025