🔬 Introduction aux Tests Statistiques avec Hypothèses (Exemples en SVTE)
Les tests statistiques permettent de vérifier si les données observées confirment ou réfutent une hypothèse scientifique. Ils sont essentiels pour analyser les résultats expérimentaux en biologie, écologie, géologie, et d’autres disciplines des sciences de la vie et de la Terre.
Chaque test statistique se base sur deux hypothèses fondamentales :
- H0 : L’hypothèse nulle, qui suppose qu’il n’y a pas de différence ou d’effet significatif.
- H1 : L’hypothèse alternative, qui indique qu’il existe une différence ou un effet significatif.
🔑 Qu’est-ce que la valeur p ?
La valeur p est la probabilité d’obtenir un résultat aussi extrême (ou plus extrême) que celui observé, si l’hypothèse nulle H0 est vraie.
- Une valeur p faible (généralement < 0.05) signifie que les résultats observés sont peu probables sous H0. Dans ce cas, on rejette H0 et on considère que l’effet est statistiquement significatif.
- Une valeur p élevée (≥ 0.05) indique que les données sont compatibles avec H0, et donc, on ne rejette pas H0.
📏 Exemple : Si tu compares la taille moyenne de deux espèces de plantes et que tu trouves une valeur p de 0.02 :
➡️ Il y a seulement 2 % de chances d’observer une telle différence si les deux espèces ont réellement la même taille moyenne.
➡️ Conclusion : On rejette H0 et on considère qu’il y a une différence significative de taille entre les deux espèces.
Les tests peuvent être classés en deux grandes catégories :
1️⃣ Tests Paramétriques → Nécessitent que les données suivent une distribution normale.
2️⃣ Tests Non Paramétriques → Utilisés lorsque les données ne suivent pas de distribution spécifique.
Ce guide explique comment choisir le bon test et interpréter les résultats à travers des exemples adaptés aux sciences de la vie, de la Terre et de l’environnement.
🔍 1. Tests Paramétriques
Ces tests supposent que les données suivent une distribution spécifique, généralement une loi normale (courbe en cloche).
✅ Test T de Student (ou T² de Hotelling pour des données multivariées)
➡️ Utilisé pour comparer les moyennes de deux groupes.
- H0 : Les moyennes des deux groupes sont égales.
- H1 : Les moyennes des deux groupes sont différentes.
📏 Exemple : Comparer la taille moyenne de deux espèces de plantes.
🔴 Rejet de H0 si la valeur p < 0.05 → Il y a une différence significative entre les deux moyennes.
✅ ANOVA (Analyse de Variance)
➡️ Pour comparer les moyennes entre plus de deux groupes.
- H0 : Toutes les moyennes des groupes sont égales.
- H1 : Au moins une moyenne diffère des autres.
📏 Exemple : Comparer la croissance de trois types d’algues sous différentes intensités lumineuses.
🔴 Rejet de H0 si p < 0.05 → Il existe au moins une différence significative entre les groupes.
✅ Régression linéaire
➡️ Analyse la relation entre deux variables continues.
- H0 : Il n’y a pas de relation linéaire entre les deux variables.
- H1 : Il existe une relation linéaire significative.
📏 Exemple : Étudier la corrélation entre la température et la vitesse de décomposition des feuilles.
🔴 Rejet de H0 si p < 0.05 → Une relation linéaire significative est présente.
📊 2. Tests Non Paramétriques
Aucun prérequis sur la distribution des données. Ces tests sont plus robustes pour des données qui ne suivent pas la loi normale.
✅ Test du Chi² (Chi-carré)
➡️ Vérifie si les fréquences observées diffèrent des fréquences attendues.
- H0 : Les fréquences observées correspondent aux fréquences attendues.
- H1 : Les fréquences observées diffèrent significativement des fréquences attendues.
📏 Exemple : Tester si la distribution des couleurs de fleurs suit un modèle mendélien.
🔴 Rejet de H0 si p < 0.05 → La distribution observée diffère de la distribution attendue.
✅ Test de Poisson
➡️ Utilisé pour des événements rares dans un espace ou un temps donné.
- H0 : Le nombre d’événements suit une distribution de Poisson.
- H1 : Le nombre d’événements ne suit pas une distribution de Poisson.
📏 Exemple : Analyser la répartition des espèces rares dans une parcelle forestière.
🔴 Rejet de H0 si p < 0.05 → La distribution ne suit pas un modèle de Poisson.
✅ Test de Mann-Whitney
➡️ Alternative non paramétrique au test T de Student.
- H0 : Les deux groupes ont des distributions similaires.
- H1 : Les deux groupes ont des distributions différentes.
📏 Exemple : Comparer la taille de deux populations d’insectes sans supposer une distribution normale.
🔴 Rejet de H0 si p < 0.05 → Il y a une différence significative entre les deux distributions.
✅ TEST DE KRUSKAL-WALLIS
➡️ Alternative non paramétrique à l’ANOVA pour comparer plus de deux groupes.
H0 : Les distributions des groupes sont similaires.
H1 : Au moins un groupe a une distribution significativement différente des autres.
📏 Exemple : Comparer la croissance de trois types de champignons sous différents niveaux d’humidité sans supposer de distribution normale.
🔴 Rejet de H0 si p < 0.05 → Il existe au moins une différence significative entre les groupes.
🔢 3. Tests de Normalité
Avant de choisir entre un test paramétrique ou non paramétrique, il faut vérifier si les données suivent une loi normale.
✅ Test de Shapiro-Wilk
➡️ Vérifie la normalité des données.
- H0 : Les données suivent une loi normale.
- H1 : Les données ne suivent pas une loi normale.
📏 Exemple : Tester si les données de pH d’un lac suivent une distribution normale.
🔴 Rejet de H0 si p < 0.05 → Les données ne suivent pas une distribution normale.
✅ Test de Kolmogorov-Smirnov
➡️ Compare une distribution observée avec une distribution théorique.
- H0 : La distribution observée correspond à la distribution théorique.
- H1 : La distribution observée diffère de la distribution théorique.
📏 Exemple : Vérifier si la distribution des tailles de poissons correspond à une loi normale.
🔴 Rejet de H0 si p < 0.05 → La distribution des données diffère de celle attendue.
✅ Comment Choisir le Bon Test ?
1️⃣ Les données suivent-elles une loi normale ?
➡️ Oui → Utiliser un test paramétrique
➡️ Non → Utiliser un test non paramétrique
2️⃣ Combien de groupes dois-je comparer ?
➡️ 2 groupes → Test T (paramétrique) ou Mann-Whitney (non paramétrique)
➡️ Plus de 2 groupes → ANOVA (paramétrique) ou Kruskal-Wallis (non paramétrique)
3️⃣ Les données sont-elles des fréquences ?
➡️ Oui → Test du Chi²
4️⃣ Quand rejeter H0 ?
➡️ Si la valeur p < 0.05 (ou un seuil choisi, par ex. 0.01) → On rejette H0
➡️ Si la valeur p ≥ 0.05 → On ne rejette pas H0 (les résultats ne sont pas significatifs)