stat-i301 chapitre vi: m thodes non param...

39
STAT-I301 Chapitre VI: M ´ ethodes non param ´ etriques Caroline Verhoeven

Upload: others

Post on 20-Mar-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

STAT-I301Chapitre VI: Methodes non parametriques

Caroline Verhoeven

Table des matieres

1 Test de Mann-Whitney

2 Test de rangs de Wilcoxon pour 2 echantillons apparies

3 Coefficient de correlation de rangs de SpearmanCalcul du coefficient de correlationTest de significativite pour rs

Caroline Verhoeven STAT-I301 2 / 39

1. Test de Mann-Whitney

Test de Mann-Whitney : Exemple I

Exemple 1

Chez le grillon des sauges (Cyphoderrisstrepitans), durant l’accouplement, la fe-melle grignote les extremites des ailes dumale.En 1999, Johnson et al. se sont demandesi une femelle affamee aura plus facilementtendance a s’accoupler.Ils ont pris 24 grillons et ont choisi un groupede N1 = 11 au hasard qu’ils ont affame,l’autre groupe de N2 = 13 a ete nourri.Apres quoi chaque femelle a ete mise dansune cage avec 1 male, et on a enregistre letemps d’attente pour l’accouplementLes mesures se trouvent sur le slide suivant

Caroline Verhoeven STAT-I301 3 / 39

1. Test de Mann-Whitney

Test de Mann-Whitney : Exemple II

Exemple 1

faim nourri1,9 1,52,1 1,73,8 2,49,0 3,69,6 5,7

13,0 22,614,7 22,817,9 39,021,7 54,429,0 72,172,3 73,6

79,588,9

Caroline Verhoeven STAT-I301 4 / 39

1. Test de Mann-Whitney

Mann-Whitney : Exemple III

Femelles affamees

0 20 40 60 80 1000

2

4

6

8

temps

nom

bre

Femelles nouries

0 20 40 60 80 1000

2

4

6

8

tempsno

mbr

eClairement non normal

Caroline Verhoeven STAT-I301 5 / 39

1. Test de Mann-Whitney

Test de Mann-Whitney : Principes

Egalement appele test de rangs de Wilcoxon pour 2 echantillonsindependants

equivalent non-parametrique du test t pour 2 echantillonsindependantsFormulation des hypotheses

H0 : µ1 = µ2 medianes !Ha : µ1 6= µ2

Caroline Verhoeven STAT-I301 6 / 39

1. Test de Mann-Whitney

Mann-Whitney : Calcul et resolution de l’exemple I

1 Classer les mesures de la plus petite a la plus grande, tous groupesconfondus

Exemple 1

groupe temps classement groupe temps classement2 1,5 1 1 17,9 132 1,7 2 1 21,7 141 1,9 3 2 22,6 151 2,1 4 2 22,8 162 2,4 5 1 29,0 172 3,6 6 2 39,0 181 3,8 7 2 54,4 192 5,7 8 2 72,1 201 9,0 9 1 72,3 211 9,6 10 2 73,6 221 13,0 11 2 79,5 231 14,7 12 2 88,9 24

Caroline Verhoeven STAT-I301 7 / 39

1. Test de Mann-Whitney

Mann-Whitney : Calcul et resolution de l’exemple II

2 Calculer la somme des classements du plus petit groupe :

Exemple 1

r1 = 3 + 4 + 7 + 9 + 10 + 11 + 12 + 13 + 14 + 17 + 21 = 121.

3 Calcul de la statistique : r1

Caroline Verhoeven STAT-I301 8 / 39

1. Test de Mann-Whitney

Mann-Whitney : Calcul et resolution de l’exemple III

4 Comparer la statistique avec la table de Wilcoxon

Exemple 1

Ici on regarde un test bilateral et on veut savoir si il y a une difference aα = 0, 05.On regarde dans la table pour α = 0, 05 et N1 = 11, N2 = 13 et on voit 2nombres :

w0,025 = 103 w0,975 = 172

Si r1 ≤ w0,025 ou r1 ≥ w0,975 ⇒ On rejette H0

Si w0,025 < r1 < w0,975 ⇒ On ne rejette pas H0

Ici :w0,025 = 103 < r1 = 121 < w0,975 = 172

⇒ On ne rejette pas H0

Caroline Verhoeven STAT-I301 9 / 39

1. Test de Mann-Whitney

Valeur attendue pour R1 I

On sait quen

i=1

i = 1 + 2 + · · ·+ n =n(n + 1)

2

Si on additionne tous le classements, on a

1 + 2 + · · ·+ (N1 + N2) =(N1 + N2)(N1 + N2 + 1)

2

La moyenne des classements est donnee par

1N1 + N2

(1 + 2 + · · ·+ (N1 + N2)) =N1 + N2 + 1

2

Caroline Verhoeven STAT-I301 10 / 39

1. Test de Mann-Whitney

Valeur attendue pour R1 II

La valeur attendue E(R1), si H0 est vraie, est proportionnelle :au nombre de sujets dans le groupe 1 : N1

a la moyenne des classementsN1 + N2 + 1

2Et donc :

E(R1) = N1N1 + N2 + 1

2

Caroline Verhoeven STAT-I301 11 / 39

1. Test de Mann-Whitney

Si les echantillons sont grands ?

Si N1 et N2 sont trop grands, ils ne sont plus dans les tables.Alors, on calcule

z =r1 − E(R1)

s(R1), s(R1) =

N1N2(N1 + N2 + 1)12

Z ∼ N (0, 1)Si on regarde un test bilateral a un taux α = 0, 05 :

On rejette H0 si z < −1, 96 ou z > 1, 96

On ne rejette pas H0 si −1, 96 < z < 1, 96

Caroline Verhoeven STAT-I301 12 / 39

1. Test de Mann-Whitney

Classement avec mesures egales

Comment classe-t-on si on a plusieurs fois la meme mesure ?

Exemple 2

Considerons les mesures fictives

groupe xi classement2 12 12 14 21 17 31 19 4,52 19 4,51 24 62 27 71 28 8

Classement des mesures egales : moyenne des places qu’ellesprennent

Caroline Verhoeven STAT-I301 13 / 39

1. Test de Mann-Whitney

Test de Mann-Whitney : conditions

Il n’y a pas de conditions sur la distribution de la population

Les distributions de 2 populations doivent avoir la meme forme

Les 2 echantillons sont aleatoires simples

Les 2 echantillons sont independants

Caroline Verhoeven STAT-I301 14 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Exemple I

Exemple 3

En 2002, Haguenauer a etudie le pas debase de la danse sur glace. Il a etudiel’impact de la position de la jambe d’ap-pui en phase de repositionnement apresune poussee. La jambe peut etre enflexion ou en extension.La difference des position a-t-elle un im-pact sur la vitesse du patineur ?On a demande de faire le meme pas, 1fois avec la jambe en extension et 1 foisavec la jambe en flexion a N = 7 pati-neurs. La velocite de poussee a ete en-registree.

Caroline Verhoeven STAT-I301 15 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Exemple II

Exemple 3

patineur E F1 2,13 1,902 1,77 1,553 1,68 1,624 2,04 1,895 2,12 2,016 1,92 1,917 2,08 2,10

Caroline Verhoeven STAT-I301 16 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Principes

Egalement appele test de Wilcoxon des rangs signes

Equivalent non-parametrique du test t pour 2 echantillons apparies

Hypothese sur la mediane δ des difference entre les 2 mesures d’1paireFormulation des hypotheses

H0 : δ = 0Ha : δ 6= 0

Caroline Verhoeven STAT-I301 17 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple I

1 Calcul des differences di = xi1 − xi2 entre les 2 mesures2 Calcul des valeurs absolues |di |

Exemple 3

i xi1 xi2 di |di |1 2,13 1,90 0,23 0,232 1,77 1,55 0,22 0,223 1,68 1,62 0,06 0,064 2,04 1,89 0,15 0,155 2,12 2,01 0,11 0,116 1,92 1,91 0,01 0,017 2,08 2,10 -0,02 0,02

Caroline Verhoeven STAT-I301 18 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple II

3 Classement des |di | de la plus petite a la plus grande.Si di = 0, on elimine la donnee de l’analyse. (Il nous reste n donnees)Si 2 differences sont identiques, on prend la moyenne de leur place

Exemple 3

i xi1 xi2 di |di | classement1 2,13 1,90 0,23 0,23 72 1,77 1,55 0,22 0,22 63 1,68 1,62 0,06 0,06 34 2,04 1,89 0,15 0,15 55 2,12 2,01 0,11 0,11 46 1,92 1,91 0,01 0,01 17 2,08 2,10 -0,02 0,02 2

Caroline Verhoeven STAT-I301 19 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple II

4 On regarde les classement des differences positives et negatives5 On prend la somme des c+ et la somme des c-

Exemple 3

i xi1 xi2 di |di | classement c+ c-1 2,13 1,90 0,23 0,23 7 72 1,77 1,55 0,22 0,22 6 63 1,68 1,62 0,06 0,06 3 34 2,04 1,89 0,15 0,15 5 55 2,12 2,01 0,11 0,11 4 46 1,92 1,91 0,01 0,01 1 17 2,08 2,10 -0,02 0,02 2 2

t+ = 26 t− = 2

Caroline Verhoeven STAT-I301 20 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple II

6 Prendre le plus petit entre les t+ et t−, on le nomme t

Exemple 3

Dans notre example, on a t = t− = 2

Caroline Verhoeven STAT-I301 21 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple III

6 On compare t avec la table de Wilcoxon pour 2 echantillons apparies

Exemple 3

Ici on regarde un test bilateral et on veut savoir si il y a une difference aα = 0, 05.On regarde dans la table pour α = 0, 05 et n = 7 et on voit le nombres :

t0,025 = 3

Caroline Verhoeven STAT-I301 22 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Wilcoxon pour 2 echantillons apparies : Calcul etresolution de l’exemple IV

Exemple 3

Si t ≤ t0,025 ou t ≥ t0,975 ⇒ On rejette H0

Si t0,025 < t < t0,975 ⇒ On ne rejette pas H0

Ici :t = 2 < t0,025 = 3

⇒ On rejette H0

Caroline Verhoeven STAT-I301 23 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Valeur attendue pour T

Si H0 est vrai, on s’attend a ce que la somme des classements dedifference negative soit la meme que celle des classements desdifferences positives :

E(T−) = E(T+)

On sait que la somme totale des classements est :

t+ + t− = 1 + 2 + · · ·+ n =n(n + 1)

2

En combinant les 2 infos, on obtient :

E(T−) = E(T+) =12

n(n + 1)2

=n(n + 1)

4

La distribution T de Wilcoxon est symetrique autour de n(n + 1)/4

Caroline Verhoeven STAT-I301 24 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Si les echantillons sont grands

Si n est trop grand pour le trouver dans les tables, on calcule

z =t − E(T )

s(T )s(T ) =

n(n + 1)(2n + 1)24

Z ∼ N (0, 1) Si on regarde un test bilateral a un taux α = 0, 05 :

On rejette H0 si z < −1, 96 ou z > 1, 96

On ne rejette pas H0 si −1, 96 < z < 1, 96

Caroline Verhoeven STAT-I301 25 / 39

2. Test de rangs de Wilcoxon pour 2 echantillons apparies

Test de rangs de Wilcoxon pour 2 echantillonsapparies : conditions

La distribution ne doit pas etre trop asymetrique

Les donnees ne peuvent pas etre biaisees

Les sujets doivent etre independants

Caroline Verhoeven STAT-I301 26 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Coefficient de correlation de Spearman : Exemple I

Exemple 4

En 1986, Woloschuk a etudie le lien entre laperformance d’une equipe de basket-ball etsa volonte de gagner.Durant un tournoi, il a donne un question-naire mesurant la volonte de gagner auxjoueuses de 18 equipes,On a enregistre le score moyen pour la vo-lonte de vaincre par equipe et le nombre depoints moyen de cette equipe pour le tour-noi ?

Le score pour la volonte de vaincre est-ilrelie au nombre de points moyen obtenuspar l’equipe ?Les donnees se trouvent sur le slide suivant

Caroline Verhoeven STAT-I301 27 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Coefficient de correlation de Spearman : Exemple II

Exemple 4

equipe vaincre points equipe vaincre points1 9,50 46,25 10 7,71 30,332 9,46 40,50 11 7,64 22,003 9,00 41,20 12 7,56 40,754 8,90 48,75 13 7,17 39,505 8,55 45,00 14 7,00 42,756 8,22 43,00 15 7,00 28,507 8,18 28,50 16 6,50 42,508 8,09 46,20 17 6,29 25,339 7,80 27,66 18 5,75 41,00

Caroline Verhoeven STAT-I301 28 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Coefficient de correlation de Spearman : Exemple II

Exemple 4

Nuage de points pour cet exemple

6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.520253035404550

volonté de vaincre

poin

ts

Caroline Verhoeven STAT-I301 29 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Coefficient de correlation de Spearman : Calcul etresolution de l’exemple I

1 Determiner le classement des mesures x et des mesures y . Si 2mesures sont identiques, on prend la moyenne de leur place.

Exemple 4

i xi yi cx,i cy,i

1 9,50 46,25 18 172 9,46 40,50 17 83 9,00 41,20 16 114 8,90 48,75 15 185 8,55 45,00 14 156 8,22 43,00 13 147 8,18 28,50 12 48 8,09 46,20 11 16...

......

......

18 5,75 41,00 1 10

Caroline Verhoeven STAT-I301 30 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Coefficient de correlation de Spearman : Calcul etresolution de l’exemple II

2 Prendre la difference entre les 2 classements di = cx ,i − cyi3 Calculer d2

i

Exemple 4

i xi yi cx,i cy,i di d2i

1 9,50 46,25 18 17 1 12 9,46 40,50 17 8 9 813 9,00 41,20 16 11 5 254 8,90 48,75 15 18 -3 95 8,55 45,00 14 15 -1 16 8,22 43,00 13 14 -1 17 8,18 28,50 12 4 8 648 8,09 46,20 11 16 -5 25...

......

......

18 5,75 41,00 1 10 -9 81

Caroline Verhoeven STAT-I301 31 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Coefficient de correlation de Spearman : Calcul etresolution de l’exemple II

4 Calculer le total des d2i

Exemple 4

i xi yi cx,i cy,i di d2i

1 9,50 46,25 18 17 1 12 9,46 40,50 17 8 9 813 9,00 41,20 16 11 5 254 8,90 48,75 15 18 -3 95 8,55 45,00 14 15 -1 16 8,22 43,00 13 14 -1 17 8,18 28,50 12 4 8 648 8,09 46,20 11 16 -5 25...

......

......

18 5,75 41,00 1 10 -9 81663,5

Caroline Verhoeven STAT-I301 32 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Coefficient de correlation de Spearman : Calcul etresolution de l’exemple III

5 Calculer le coefficient de correlation de Spearman rs

rs = 1 −6∑N

i=1 d2i

N(N2 − 1)

Exemple 4

Dans notre exemple :

rs = 1 −6 · 663, 5

18(182 − 1)= 0, 315

Remarque 5

−1 ≤ rs ≤ 1

Caroline Verhoeven STAT-I301 33 / 39

3. Coefficient de correlation de rangs de Spearman 1. Calcul du coefficient de correlation

Formule et ex aequo

La formule

rs = 1 −6∑N

i=1 d2i

N(N2 − 1)

n’est exacte que si il n’y a pas d’ex aequos dans les mesures !Si il y a des ex aequos, on utilise la formule

rs =

∑Ni=1(cx ,i − cx)(cy ,i − cy )

∑Ni=1(cx ,i − cx)2

∑Ni=1(cy ,i − cy )2

cx et cy : moyenne des classe-ments pour x et y :

cx = cy =N + 1

2

Caroline Verhoeven STAT-I301 34 / 39

3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs

Test de significativite pour rs : Exemple

Exemple 4

Dans l’exemple de basket, nous avons obtenu un coefficient decorrelation de rangs de Spearman

rs = 0, 315.

Peut-on conclure a partir de cet exemple, que la performance d’uneequipe est relie a sa volonte de vaincre, avec un taux α = 0, 05 ?

Caroline Verhoeven STAT-I301 35 / 39

3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs

Test de significativite pour rs : Principe

ρs : Coefficient de correlation de Spearman pour la populationFormulation d’hypotheses

H0 : ρs = 0Ha : ρs 6= 0

Calcul de la statistique : rs

On regarde dans la table de distribution du coefficient de correlationdu Spearman le nombre rN,1−α/2

rs ≤ −rN;1−α/2 ou rs ≥ rN;1−α/2 ⇒ on rejette H0

−rN;1−α/2 < rs < rN;1−α/2 ⇒ on ne rejette pas H0

Caroline Verhoeven STAT-I301 36 / 39

3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs

Test de significativite pour rs : Resolution de l’exemple

Exemple 4

Formulation d’hypothesesH0 : ρs = 0Ha : ρs 6= 0

Calcul de la statistique : rs = 0, 315

On regarde dans la table de distribution du coefficient de correlationdu Spearman : r18;0,975 = 0, 472

rs = 0, 315 < r18;0,975 = 0, 472

⇒ On ne rejette pas H0

Caroline Verhoeven STAT-I301 37 / 39

3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs

Si les echantillons sont grands

Si N est trop grand pour le trouver dans les tables, on calcule

t =rs

srs

, srs =

1 − r2s

N − 2

T ∼ t(df = N − 2)

Caroline Verhoeven STAT-I301 38 / 39

3. Coefficient de correlation de rangs de Spearman 2. Test de significativite pour rs

Correlation de Spearman : Conditions

Les echantillons sont aleatoires simples

La relation entre les 2 classements doit etre lineaire

Caroline Verhoeven STAT-I301 39 / 39