stat-i301 chapitre vi: m thodes non param...
TRANSCRIPT
Table des matieres
1 Test de Mann-Whitney
2 Test de rangs de Wilcoxon pour 2 echantillons apparies
3 Coefficient de correlation de rangs de SpearmanCalcul du coefficient de correlationTest de significativite pour rs
Caroline Verhoeven STAT-I301 2 / 39
1. Test de Mann-Whitney
Test de Mann-Whitney : Exemple I
Exemple 1
Chez le grillon des sauges (Cyphoderrisstrepitans), durant l’accouplement, la fe-melle grignote les extremites des ailes dumale.En 1999, Johnson et al. se sont demandesi une femelle affamee aura plus facilementtendance a s’accoupler.Ils ont pris 24 grillons et ont choisi un groupede N1 = 11 au hasard qu’ils ont affame,l’autre groupe de N2 = 13 a ete nourri.Apres quoi chaque femelle a ete mise dansune cage avec 1 male, et on a enregistre letemps d’attente pour l’accouplementLes mesures se trouvent sur le slide suivant
Caroline Verhoeven STAT-I301 3 / 39
1. Test de Mann-Whitney
Test de Mann-Whitney : Exemple II
Exemple 1
faim nourri1,9 1,52,1 1,73,8 2,49,0 3,69,6 5,7
13,0 22,614,7 22,817,9 39,021,7 54,429,0 72,172,3 73,6
79,588,9
Caroline Verhoeven STAT-I301 4 / 39
1. Test de Mann-Whitney
Mann-Whitney : Exemple III
Femelles affamees
0 20 40 60 80 1000
2
4
6
8
temps
nom
bre
Femelles nouries
0 20 40 60 80 1000
2
4
6
8
tempsno
mbr
eClairement non normal
Caroline Verhoeven STAT-I301 5 / 39
1. Test de Mann-Whitney
Test de Mann-Whitney : Principes
Egalement appele test de rangs de Wilcoxon pour 2 echantillonsindependants
equivalent non-parametrique du test t pour 2 echantillonsindependantsFormulation des hypotheses
H0 : µ1 = µ2 medianes !Ha : µ1 6= µ2
Caroline Verhoeven STAT-I301 6 / 39
1. Test de Mann-Whitney
Mann-Whitney : Calcul et resolution de l’exemple I
1 Classer les mesures de la plus petite a la plus grande, tous groupesconfondus
Exemple 1
groupe temps classement groupe temps classement2 1,5 1 1 17,9 132 1,7 2 1 21,7 141 1,9 3 2 22,6 151 2,1 4 2 22,8 162 2,4 5 1 29,0 172 3,6 6 2 39,0 181 3,8 7 2 54,4 192 5,7 8 2 72,1 201 9,0 9 1 72,3 211 9,6 10 2 73,6 221 13,0 11 2 79,5 231 14,7 12 2 88,9 24
Caroline Verhoeven STAT-I301 7 / 39
1. Test de Mann-Whitney
Mann-Whitney : Calcul et resolution de l’exemple II
2 Calculer la somme des classements du plus petit groupe :
Exemple 1
r1 = 3 + 4 + 7 + 9 + 10 + 11 + 12 + 13 + 14 + 17 + 21 = 121.
3 Calcul de la statistique : r1
Caroline Verhoeven STAT-I301 8 / 39
1. Test de Mann-Whitney
Mann-Whitney : Calcul et resolution de l’exemple III
4 Comparer la statistique avec la table de Wilcoxon
Exemple 1
Ici on regarde un test bilateral et on veut savoir si il y a une difference aα = 0, 05.On regarde dans la table pour α = 0, 05 et N1 = 11, N2 = 13 et on voit 2nombres :
w0,025 = 103 w0,975 = 172
Si r1 ≤ w0,025 ou r1 ≥ w0,975 ⇒ On rejette H0
Si w0,025 < r1 < w0,975 ⇒ On ne rejette pas H0
Ici :w0,025 = 103 < r1 = 121 < w0,975 = 172
⇒ On ne rejette pas H0
Caroline Verhoeven STAT-I301 9 / 39
1. Test de Mann-Whitney
Valeur attendue pour R1 I
On sait quen
∑
i=1
i = 1 + 2 + · · ·+ n =n(n + 1)
2
Si on additionne tous le classements, on a
1 + 2 + · · ·+ (N1 + N2) =(N1 + N2)(N1 + N2 + 1)
2
La moyenne des classements est donnee par
1N1 + N2
(1 + 2 + · · ·+ (N1 + N2)) =N1 + N2 + 1
2
Caroline Verhoeven STAT-I301 10 / 39
1. Test de Mann-Whitney
Valeur attendue pour R1 II
La valeur attendue E(R1), si H0 est vraie, est proportionnelle :au nombre de sujets dans le groupe 1 : N1
a la moyenne des classementsN1 + N2 + 1
2Et donc :
E(R1) = N1N1 + N2 + 1
2
Caroline Verhoeven STAT-I301 11 / 39
1. Test de Mann-Whitney
Si les echantillons sont grands ?
Si N1 et N2 sont trop grands, ils ne sont plus dans les tables.Alors, on calcule
z =r1 − E(R1)
s(R1), s(R1) =
√
N1N2(N1 + N2 + 1)12
Z ∼ N (0, 1)Si on regarde un test bilateral a un taux α = 0, 05 :
On rejette H0 si z < −1, 96 ou z > 1, 96
On ne rejette pas H0 si −1, 96 < z < 1, 96
Caroline Verhoeven STAT-I301 12 / 39
1. Test de Mann-Whitney
Classement avec mesures egales
Comment classe-t-on si on a plusieurs fois la meme mesure ?
Exemple 2
Considerons les mesures fictives
groupe xi classement2 12 12 14 21 17 31 19 4,52 19 4,51 24 62 27 71 28 8
Classement des mesures egales : moyenne des places qu’ellesprennent
Caroline Verhoeven STAT-I301 13 / 39
1. Test de Mann-Whitney
Test de Mann-Whitney : conditions
Il n’y a pas de conditions sur la distribution de la population
Les distributions de 2 populations doivent avoir la meme forme
Les 2 echantillons sont aleatoires simples
Les 2 echantillons sont independants
Caroline Verhoeven STAT-I301 14 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Exemple I
Exemple 3
En 2002, Haguenauer a etudie le pas debase de la danse sur glace. Il a etudiel’impact de la position de la jambe d’ap-pui en phase de repositionnement apresune poussee. La jambe peut etre enflexion ou en extension.La difference des position a-t-elle un im-pact sur la vitesse du patineur ?On a demande de faire le meme pas, 1fois avec la jambe en extension et 1 foisavec la jambe en flexion a N = 7 pati-neurs. La velocite de poussee a ete en-registree.
Caroline Verhoeven STAT-I301 15 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Exemple II
Exemple 3
patineur E F1 2,13 1,902 1,77 1,553 1,68 1,624 2,04 1,895 2,12 2,016 1,92 1,917 2,08 2,10
Caroline Verhoeven STAT-I301 16 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Principes
Egalement appele test de Wilcoxon des rangs signes
Equivalent non-parametrique du test t pour 2 echantillons apparies
Hypothese sur la mediane δ des difference entre les 2 mesures d’1paireFormulation des hypotheses
H0 : δ = 0Ha : δ 6= 0
Caroline Verhoeven STAT-I301 17 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple I
1 Calcul des differences di = xi1 − xi2 entre les 2 mesures2 Calcul des valeurs absolues |di |
Exemple 3
i xi1 xi2 di |di |1 2,13 1,90 0,23 0,232 1,77 1,55 0,22 0,223 1,68 1,62 0,06 0,064 2,04 1,89 0,15 0,155 2,12 2,01 0,11 0,116 1,92 1,91 0,01 0,017 2,08 2,10 -0,02 0,02
Caroline Verhoeven STAT-I301 18 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple II
3 Classement des |di | de la plus petite a la plus grande.Si di = 0, on elimine la donnee de l’analyse. (Il nous reste n donnees)Si 2 differences sont identiques, on prend la moyenne de leur place
Exemple 3
i xi1 xi2 di |di | classement1 2,13 1,90 0,23 0,23 72 1,77 1,55 0,22 0,22 63 1,68 1,62 0,06 0,06 34 2,04 1,89 0,15 0,15 55 2,12 2,01 0,11 0,11 46 1,92 1,91 0,01 0,01 17 2,08 2,10 -0,02 0,02 2
Caroline Verhoeven STAT-I301 19 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple II
4 On regarde les classement des differences positives et negatives5 On prend la somme des c+ et la somme des c-
Exemple 3
i xi1 xi2 di |di | classement c+ c-1 2,13 1,90 0,23 0,23 7 72 1,77 1,55 0,22 0,22 6 63 1,68 1,62 0,06 0,06 3 34 2,04 1,89 0,15 0,15 5 55 2,12 2,01 0,11 0,11 4 46 1,92 1,91 0,01 0,01 1 17 2,08 2,10 -0,02 0,02 2 2
t+ = 26 t− = 2
Caroline Verhoeven STAT-I301 20 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple II
6 Prendre le plus petit entre les t+ et t−, on le nomme t
Exemple 3
Dans notre example, on a t = t− = 2
Caroline Verhoeven STAT-I301 21 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple III
6 On compare t avec la table de Wilcoxon pour 2 echantillons apparies
Exemple 3
Ici on regarde un test bilateral et on veut savoir si il y a une difference aα = 0, 05.On regarde dans la table pour α = 0, 05 et n = 7 et on voit le nombres :
t0,025 = 3
Caroline Verhoeven STAT-I301 22 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple IV
Exemple 3
Si t ≤ t0,025 ou t ≥ t0,975 ⇒ On rejette H0
Si t0,025 < t < t0,975 ⇒ On ne rejette pas H0
Ici :t = 2 < t0,025 = 3
⇒ On rejette H0
Caroline Verhoeven STAT-I301 23 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Valeur attendue pour T
Si H0 est vrai, on s’attend a ce que la somme des classements dedifference negative soit la meme que celle des classements desdifferences positives :
E(T−) = E(T+)
On sait que la somme totale des classements est :
t+ + t− = 1 + 2 + · · ·+ n =n(n + 1)
2
En combinant les 2 infos, on obtient :
E(T−) = E(T+) =12
n(n + 1)2
=n(n + 1)
4
La distribution T de Wilcoxon est symetrique autour de n(n + 1)/4
Caroline Verhoeven STAT-I301 24 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Si les echantillons sont grands
Si n est trop grand pour le trouver dans les tables, on calcule
z =t − E(T )
s(T )s(T ) =
√
n(n + 1)(2n + 1)24
Z ∼ N (0, 1) Si on regarde un test bilateral a un taux α = 0, 05 :
On rejette H0 si z < −1, 96 ou z > 1, 96
On ne rejette pas H0 si −1, 96 < z < 1, 96
Caroline Verhoeven STAT-I301 25 / 39
2. Test de rangs de Wilcoxon pour 2 echantillons apparies
Test de rangs de Wilcoxon pour 2 echantillonsapparies : conditions
La distribution ne doit pas etre trop asymetrique
Les donnees ne peuvent pas etre biaisees
Les sujets doivent etre independants
Caroline Verhoeven STAT-I301 26 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Coefficient de correlation de Spearman : Exemple I
Exemple 4
En 1986, Woloschuk a etudie le lien entre laperformance d’une equipe de basket-ball etsa volonte de gagner.Durant un tournoi, il a donne un question-naire mesurant la volonte de gagner auxjoueuses de 18 equipes,On a enregistre le score moyen pour la vo-lonte de vaincre par equipe et le nombre depoints moyen de cette equipe pour le tour-noi ?
Le score pour la volonte de vaincre est-ilrelie au nombre de points moyen obtenuspar l’equipe ?Les donnees se trouvent sur le slide suivant
Caroline Verhoeven STAT-I301 27 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Coefficient de correlation de Spearman : Exemple II
Exemple 4
equipe vaincre points equipe vaincre points1 9,50 46,25 10 7,71 30,332 9,46 40,50 11 7,64 22,003 9,00 41,20 12 7,56 40,754 8,90 48,75 13 7,17 39,505 8,55 45,00 14 7,00 42,756 8,22 43,00 15 7,00 28,507 8,18 28,50 16 6,50 42,508 8,09 46,20 17 6,29 25,339 7,80 27,66 18 5,75 41,00
Caroline Verhoeven STAT-I301 28 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Coefficient de correlation de Spearman : Exemple II
Exemple 4
Nuage de points pour cet exemple
6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.520253035404550
volonté de vaincre
poin
ts
Caroline Verhoeven STAT-I301 29 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Coefficient de correlation de Spearman : Calcul etresolution de l’exemple I
1 Determiner le classement des mesures x et des mesures y . Si 2mesures sont identiques, on prend la moyenne de leur place.
Exemple 4
i xi yi cx,i cy,i
1 9,50 46,25 18 172 9,46 40,50 17 83 9,00 41,20 16 114 8,90 48,75 15 185 8,55 45,00 14 156 8,22 43,00 13 147 8,18 28,50 12 48 8,09 46,20 11 16...
......
......
18 5,75 41,00 1 10
Caroline Verhoeven STAT-I301 30 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Coefficient de correlation de Spearman : Calcul etresolution de l’exemple II
2 Prendre la difference entre les 2 classements di = cx ,i − cyi3 Calculer d2
i
Exemple 4
i xi yi cx,i cy,i di d2i
1 9,50 46,25 18 17 1 12 9,46 40,50 17 8 9 813 9,00 41,20 16 11 5 254 8,90 48,75 15 18 -3 95 8,55 45,00 14 15 -1 16 8,22 43,00 13 14 -1 17 8,18 28,50 12 4 8 648 8,09 46,20 11 16 -5 25...
......
......
18 5,75 41,00 1 10 -9 81
Caroline Verhoeven STAT-I301 31 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Coefficient de correlation de Spearman : Calcul etresolution de l’exemple II
4 Calculer le total des d2i
Exemple 4
i xi yi cx,i cy,i di d2i
1 9,50 46,25 18 17 1 12 9,46 40,50 17 8 9 813 9,00 41,20 16 11 5 254 8,90 48,75 15 18 -3 95 8,55 45,00 14 15 -1 16 8,22 43,00 13 14 -1 17 8,18 28,50 12 4 8 648 8,09 46,20 11 16 -5 25...
......
......
18 5,75 41,00 1 10 -9 81663,5
Caroline Verhoeven STAT-I301 32 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Coefficient de correlation de Spearman : Calcul etresolution de l’exemple III
5 Calculer le coefficient de correlation de Spearman rs
rs = 1 −6∑N
i=1 d2i
N(N2 − 1)
Exemple 4
Dans notre exemple :
rs = 1 −6 · 663, 5
18(182 − 1)= 0, 315
Remarque 5
−1 ≤ rs ≤ 1
Caroline Verhoeven STAT-I301 33 / 39
3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation
Formule et ex aequo
La formule
rs = 1 −6∑N
i=1 d2i
N(N2 − 1)
n’est exacte que si il n’y a pas d’ex aequos dans les mesures !Si il y a des ex aequos, on utilise la formule
rs =
∑Ni=1(cx ,i − cx)(cy ,i − cy )
√
∑Ni=1(cx ,i − cx)2
√
∑Ni=1(cy ,i − cy )2
cx et cy : moyenne des classe-ments pour x et y :
cx = cy =N + 1
2
Caroline Verhoeven STAT-I301 34 / 39
3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs
Test de significativite pour rs : Exemple
Exemple 4
Dans l’exemple de basket, nous avons obtenu un coefficient decorrelation de rangs de Spearman
rs = 0, 315.
Peut-on conclure a partir de cet exemple, que la performance d’uneequipe est relie a sa volonte de vaincre, avec un taux α = 0, 05 ?
Caroline Verhoeven STAT-I301 35 / 39
3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs
Test de significativite pour rs : Principe
ρs : Coefficient de correlation de Spearman pour la populationFormulation d’hypotheses
H0 : ρs = 0Ha : ρs 6= 0
Calcul de la statistique : rs
On regarde dans la table de distribution du coefficient de correlationdu Spearman le nombre rN,1−α/2
rs ≤ −rN;1−α/2 ou rs ≥ rN;1−α/2 ⇒ on rejette H0
−rN;1−α/2 < rs < rN;1−α/2 ⇒ on ne rejette pas H0
Caroline Verhoeven STAT-I301 36 / 39
3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs
Test de significativite pour rs : Resolution de l’exemple
Exemple 4
Formulation d’hypothesesH0 : ρs = 0Ha : ρs 6= 0
Calcul de la statistique : rs = 0, 315
On regarde dans la table de distribution du coefficient de correlationdu Spearman : r18;0,975 = 0, 472
rs = 0, 315 < r18;0,975 = 0, 472
⇒ On ne rejette pas H0
Caroline Verhoeven STAT-I301 37 / 39
3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs
Si les echantillons sont grands
Si N est trop grand pour le trouver dans les tables, on calcule
t =rs
srs
, srs =
√
1 − r2s
N − 2
T ∼ t(df = N − 2)
Caroline Verhoeven STAT-I301 38 / 39