statistică descriptivă
TRANSCRIPT
Statistică descriptivă
Calculul parametrilor
Călinici Tudor
2015
Obiective educaționale
Definirea și calculul valorilor parametrilor
de centralitate: media aritmetică, mediană,
modul, valoare centrală
Definirea și calculul valorilor parametrilor
de dispersie: minim, maxim, amplitudine,
variație, abatere standard, coeficient de
variație, eroare standard
Utilizarea Excel pentru calculul
parametrilor de centralitate și dispersie
Calculul parametrilor numerici
sintetici – variabile calitative Media aritmetică – cel mai uzual parametru
descriptiv
Este el suficient?
Exemplu: o populaţie cu probleme tensionale (hipotensivi şi hipertensivi), echilibraţi între ei ca număr, va avea media aritmetică a tensiunii o valoare normală... Nu corespunde cu realitatea
Parametrii statistici descriptivi
Parametrii de centralitate
Parametrii de dispersie
Parametrii de localizare
Parametrii de “normalitate”
Parametrii de centralitate
Media aritmetică a unei serii statistice x1,...xn
Fie seria: 20, 10, 30, 40, 30, 20
Media = (20+10+30+40+30+20)/6 = 25
Proprietăţi ale mediei aritmetice
Orice valoare a seriei este luată în calcul
Valorile extreme pot influenţa media aritmetică distrugându-i reprezentativitatea
Media aritmetică se situează printre valorile seriei date
Suma diferenţelor dintre valorile individuale din serie şi medie este 0
Suma pătratelor abaterilor valorilor seriei de la media aritmetică este minimul sumei pătratelor abaterilor valorilor seriei de la orice valoare reală
Mediana
Este o valoare astfel încât jumătate din observaţii îi sunt inferioare sau egale şi cealaltă jumătate îi sunt superioare sau egale
Procedura de calcul
◦ Se ordonează datele seriei în ordine crescătoare
◦ Se localizează mediana şi se detrmină valoarea ei astfel:
Dacă volumul n al seriei este impar:
• Dacă volumul n al seriei este par:
Calcul mediană
Fie seria: 20, 10, 30, 40, 30, 20
Seria ordonată este 10, 20, 20, 30, 30, 40
Talia seriei este 6 (număr par), valoarea medianei va fi media aritmetică a valorilor de pe pozițiile 3 și 4 din seria ordonată adică (20+30)/2 = 25
Fie seria: 20, 10, 30, 40, 30, 20, 50
Seria ordonată este 10, 20, 20, 30, 30, 40, 50
Talia seriei este 7 (număr impar), valoarea medianei va fi valoarea a 4-a din seria ordonată adică 30
Modulul - dominanta
Cea mai des întâlnită valoare din serie
Serii
◦ Fără modul
◦ Unimodale
◦ Multimodale
Exemplu calcul modul
Fie seria: 20, 10, 30, 40, 30, 20, 50, 20
F(10)=1; F(20)=3; F(30)=2; F(40)=1; F(50)=1
Modulul este 20, seria este unimodală
Fie seria: 20, 10, 30, 40, 30, 20, 50, 20,30
F(10)=1; F(20)=3; F(30)=3; F(40)=1; F(50)=1
Modulul este (20, 30) seria este bimodală
Valoare centrală
Fie seria 20, 10, 30, 40, 30, 20, 50, 20,30 Vc = (10+50)/2 = 30
Media geometrică
Media armonică
Media ponderată
Fie dată o serie de valori x1, , x2, ... , xn şi o
serie de ponderi p1, p2, ... , pn se defineşte
media valorilor x1, , x2, ... , xn ponderată
de către p1, p2, ... , pn cu valoarea
n
i
i
n
i
ii
p
px
MP
1
1
Exemplu de calcul
ECTS anatomie – 6; Nota 10
ECTS fiziologie – 6; Nota 9
ECTS bacteriologie – 6; Nota 8
ECTS Științele comportamentului 2; Nota 6
ECTS Educație pentru sănătate -2; Nota 7
ECTS Sociologie – 2; Nota 8
ECTS Bazele nursingului – 6; Nota 7
Media ponderată = (10*6+9*6+8*6+6*2+7*2+8*2+7*6)/(6+6+6+2+2+2+6)=246/30 = 8.2
Măsuri de dispersie
Măsurile de dispersie oferă informaţii despre
extinderea împrăştierii datelor, sau reciproc, a
gradului lor de aglomerare
Parametrii de dispersie
Minimul
Maximul
Amplitudinea =Maxim - Minim
Fie seria 20, 10, 30, 40, 30, 20, 50, 20,30 Min=10 Max=50
Amplitudinea = 50-10 =40
Variaţia
Prezintă dispersia datelor în jurul mediei
aritmetice
Fie seria: 20, 10, 30, 40, 30, 20; Media = 25
Variația = [(20-25)2 +(10-25)2+(30-25)2+
+40-25)2+(30-25)2+(20-25)2]/6 = 550/6=91.66
Abaterea standard
Fie seria: 20, 10, 30, 40, 30, 20;
Abaterea standard S = 91.66 = 9.57
Abaterea standard în condiții
normale
Intervalul medie±abatere standard – 68,3% din
observaţii
Intervalul medie±2*abatere standard – 95,5%
din observaţii
Intervalul medie±3*abatere standard – 99,7%
din observaţii
Coeficientul de variaţie
Fie seria: 20, 10, 30, 40, 30, 20;
Media = 25; Abaterea standard = 9.57
CV = 9.57/25 = 0.38
Reguli empirice de interpretare ale
coeficientului de variaţie Dacă CV <10% seria este omogenă
Dacă CV între 10 % şi 20 % seria este relativ omogenă
Dacă CV între 20 % şi 30 % seria este relativ eterogenă
Dacă CV >30% seria este eterogenă
Eroarea standard
Fie seria: 20, 10, 30, 40, 30, 20;
Talia = 6; Abaterea standard = 9.57
CV = 9.57/ 6 = 3.9
Parametrii de localizare
Cvartilele
Percentilele
Decilele
Exemplu de calcul cvartile
Fie seria: 20, 10, 30, 40, 30, 20, 50, 10, 60,
50
Seria ordonată este
10,10, 20, 20, 30, 30, 40, 50, 50,60
C1 C2=Me C3
Parametrii de normalitate
Asimetria
Boltirea
Asimetria
Boltirea
Vă mulţumesc pentru atenţie