tfzr - index - Óíèâåðçèòåò Íîâîì Ñàäójåëåíà Ñòîjàíîâ...
Post on 21-Feb-2021
9 Views
Preview:
TRANSCRIPT
Óíèâåðçèòåò ó Íîâîì Ñàäó
Òåõíè÷êè àêóëòåò "Ìèõàjëî Ïóïèí"
Jåëåíà Ñòîjàíîâ
Âåðîâàòíî£à è ñòàòèñòèêà
Áèáëèîòåêà
Ó¶áåíèöè
236
- 2019 -
Óíèâåðçèòåò ó Íîâîì Ñàäó
Òåõíè÷êè àêóëòåò "Ìèõàjëî Ïóïèí"
Jåëåíà Ñòîjàíîâ
Âåðîâàòíî£à è ñòàòèñòèêà
Çðå»àíèí
- 2019 -
Jåëåíà Ñòîjàíîâ
Âåðîâàòíî£à è ñòàòèñòèêà
åöåíçåíòè:
Ïðî. äð Òàòjàíà ðáè£, ðåäîâíè ïðîåñîð, Ôàêóëòåò òåõíè÷êèõ íàóêà, Óíèâåðçèòåò
ó Íîâîì Ñàäó
Ïðî. äð Äàíèjåëà àjòåð-èðè£, ðåäîâíè ïðîåñîð, Ïðèðîäíî-ìàòåìàòè÷êè àêóëòåò,
Óíèâåðçèòåò ó Íîâîì Ñàäó
Ïðî. äð Ìîì÷èëî Ájåëèöà, ðåäîâíè ïðîåñîð, Òåõíè÷êè àêóëòåò "Ìèõàjëî Ïóïèí",
Óíèâåðçèòåò ó Íîâîì Ñàäó
Èçäàâà÷:
Òåõíè÷êè àêóëòåò "Ìèõàjëî Ïóïèí", óðå àêîâè£à áá, 23000 Çðå»àíèí
Çà èçäàâà÷à:
Ïðî. äð Äðàãèöà àäîñàâ, äåêàí Òåõíè÷êîã àêóëòåòà "Ìèõàjëî Ïóïèí"
Òåõíè÷êà ïðèïðåìà: Jåëåíà Ñòîjàíîâ
ISBN 978-86-7672-328-7
CIP - Êàòàëîãèçàöèjà ó ïóáëèêàöèjè
Áèáëèîòåêå Ìàòèöå ñðïñêå, Íîâè Ñàä
530.16(075.8)
519.21/.24(075.8)
ÑÒÎJÀÍÎÂ, Jåëåíà
Âåðîâàòíî£à è ñòàòèñòèêà [Åëåêòðîíñêè èçâîð / Jåëåíà Ñòîjàíîâ. - Çðå»àíèí :
Òåõíè÷êè àêóëòåò "Ìèõàjëî Ïóïèí", 2019. - 1 åëåêòðîíñêè îïòè÷êè äèñê (CD-
ROM): òåêñò, èëóñòð.; 12 m. - (Áèáëèîòåêà Ó¶áåíèöè / Òåõíè÷êè àêóëòåò "Ìèõàjëî
Ïóïèí", Çðå»àíèí ; 236)
Íàñë. ñ íàñëîâíîã åêðàíà. - Áèáëèîãðàèjà.
ISBN 978-86-7672-328-7
a) Âåðîâàòíî£à b) Ñòàòèñòèêà
COBISS.SR-ID 332270855
Îäëóêîì Íàó÷íî-íàñòàâíîã âå£à Òåõíè÷êîã àêóëòåòà "Ìèõàjëî Ïóïèí" ó Çðå»àíèíó
îä 20.11.2019. ãîäèíå, îäîáðåíî jå èçäàâà»å è êîðèø£å»å îâîã ó¶áåíèêà êàî íàñòàâíîã
ñðåäñòâà
Predgovor
Ovaj ubenik je nameen studentima informa ionih tehnologija, maxinskog in-
eerstva, ineerskog menamenta i ineerstva zaxtite ivotne sredine,
ali moe biti od koristi i za ostale studente kojima matematiqke dis ipline
nisu u fokusu studiraa nego predstavaju alat i obezbeÆuju metodologiju rada
u stru i. Ubenik je odgovarajui za studente koji se prvi put susreu sa ovom
temom. Sadraj ubenika je prilagoÆen jednosemestralnom kursu predmeta Ve-
rovatnoa i statistika koji se sluxa na prvoj odnosno drugoj godini osnovnih
studija na Tehniqkom fakultetu "Mihajlo Pupin" Univerziteta u Novom Sadu.
Odabir materijala i naqin izlagaa ne zahtevaju posebna matematiqka pred-
znaa. Osnovna svrha ubenika je sistematiqno upoznavae sa osnovnim poj-
movima teorije verovatnoe i metodama matematiqke statistike, ihovo razu-
mevae i primena u stru i. Formula ije u ubeniku nisu uvek matematiqki pre-
izne, kao ni dokazi teorema (samo nekoliko je prezentovano, ilustra ije radi)
jer je fokus na objaxeima osnovnih ideja i odnosa meÆu pojmovima. Primeri su
zastupeni jer ukazuju na znaqaj i primenu teorijskih rezultata, xto doprinosi
razumevau i usvajau sadraja.
Sadraj
Uvod 1
1 Verovatnoa 3
1.1 Sluqajni dogaÆaji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Verovatnoa sluqajnog dogaÆaja . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Klasiqna defini ija . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.2 Geometrijska defini ija . . . . . . . . . . . . . . . . . . . . . 8
1.2.3 Statistiqka defini ija . . . . . . . . . . . . . . . . . . . . . 10
1.2.4 Aksiomatska defini ija . . . . . . . . . . . . . . . . . . . . . 11
1.3 Uslovna verovatnoa . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.1 Uslovna verovatnoa i nezavisnost dogaÆaja . . . . . . . . . . 15
1.3.2 Formula totalne verovatnoe i Bajesova formula . . . . . . 21
1.4 Sluqajne promenive . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4.1 Sluqajna promeniva, raspodela, funk ija raspodele . . . . 24
1.4.2 Razliqiti tipovi sluqajnih promenivih . . . . . . . . . . . 29
1.4.3 Transforma ije sluqajnih promenivih . . . . . . . . . . . . 31
1.4.4 Dvodimenzionalne sluqajne promenive . . . . . . . . . . . . 33
1.4.5 Numeriqke karakteristike sluqajnih promenivih . . . . . 40
1.4.6 Osnovne raspodele diskretnih sluqajnih promenivih . . . 46
1.4.7 Osnovne raspodele neprekidnih sluqajnih promenivih . . 48
1.4.8 Zakoni velikih brojeva i entralne graniqne teoreme . . . . 53
2 Statistika 61
2.1 Osnovni pojmovi statistike . . . . . . . . . . . . . . . . . . . . . . . 62
2.2 Analiza uzorka . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.3 Raspodele znaqajne u statistiqkim istraivaima . . . . . . . . . 66
2.4 Poda i. Grupisae i prikaz. Frekven ije . . . . . . . . . . . . . . 68
2.5 Deskriptivna statistika . . . . . . . . . . . . . . . . . . . . . . . . 72
2.5.1 Deskriptivne statistiqke mere diskretnog obeleja . . . . 73
2.5.2 Deskriptivne statistiqke mere neprekidnogobeleja . . . . 77
2.6 O ene parametara . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.6.1 Taqkaste o ene . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.6.2 Intervalne o ene . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.7 Testirae statistiqkih hipoteza . . . . . . . . . . . . . . . . . . . . 86
2.8 Regresiona analiza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
2.8.1 Uzoraqka korela ija i regresija . . . . . . . . . . . . . . . . 96
2.9 Vremenske serije . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3 Dodatak 105
3.1 Kombinatorika . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
3.2 Verovatnoa - formule . . . . . . . . . . . . . . . . . . . . . . . . . . 106
3.3 Statistika - formule . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.4 Vrednosti Laplasove funk ije. Normalna raspodela . . . . . . . . 112
3.5 Studentova t-raspodela . . . . . . . . . . . . . . . . . . . . . . . . . . 114
3.6 χ2-raspodela . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Literatura 119
Uvod
Verovatnoa i statistika su dve matematiqke dis ipline, meÆusobno nezavisne
(pre svega po nastanku) a istovremeno i meÆusobno zavisne jer jedna drugu upot-
puuju. Metodologije ove dve matematiqke dis ipline su obrnute. Verovatnoa
zakuquje od opxteg ka pojedinaqnom, od velikog ka malom. Na osnovu opxtih
saznaa o pojavi opisuje pojedinaqni sluqaj (deduktivno zakuqivae). Statis-
tika na osnovu velike koliqine pojedinaqnih sluqajeva donosi uopxtene zakuqke
o qitavoj pojavi (induktivno zakuqivae). Odnos verovatnoe i statistike se
moe prikazati xematski, slika 1.
Informa ije o
pojedinaqnim
eksperimentima
Verovatnoa←−−−−−−−−−−−−−−→Statistika
Matematiqki
model
pojave
Slika 1: Verovatnoa vs Statistika
I verovatnoa i statistika se tek u XV II veku razvijaju kao nauqne dis-
ipline. Izuqavae verovatnoe je bilo motivisano ko karskim problemima, a
statistika je ustanovena kao skup nauqnih metoda (koje pripadaju druxtvenim
naukama) za sistematiza iju podataka o stanovnixtvu i privredi za potrebe
drave.
Teorija verovatnoe se intenzivno razvija poqetkom XX veka. Prekretni a je
svakako bila aksiomatika uvedena u verovatnou, kao osnov za pravilno defini-
sae svih pojmova. Time je omoguena upotreba matematiqkih saznaa iz algebre
i analize, pre svega teorije skupova i diferen ijalnog i integralnog raquna. Ak-
siomatski zasnovana teorija verovatnoe omoguila je razvoj statistiqke teorije
i dokazivae statistiqkih zakonitosti.
Primena verovatnoe i statistike je intenzivna u mnogim oblastima nauke
(biologija, medi ina, ekonomija, psihologija...), ali i u svakodnevnom ivotu.
1
2
Poglave 1
Verovatnoa
Teorija verovatnoe je matematiqka nauka koja prouqava i opisuje zakonitosti
sluqajnih pojava. Za realnu pojavu se kae da je sluqajna kada se en rezultat,
odnosno ishod, ne moe pouzdano predvideti.
Osnovni pojam teorije verovatnoe jeste eksperiment (opit). Eksperiment je
matematiqki model realne pojave i omoguava izuqavae veza izmeÆu uzroka i
posledi e. Za potpuno razumevae nekog eksperimenta, osnovno je da se sagledaju
svi mogui ishodi i da se pravilno definixu dogaÆaji.
Osnovni zadatak verovatnoe jeste da kvantitativno iskae mogunost reali-
za ije pojedinog dogaÆaja. Verovatnoa sagledava sve mogue ishode neke sluqajne
pojave i pokuxava da "izmeri" mogunost ihove realiza ije. Tako, verovatnoa
daje matematiqki model realne pojave i obezbeÆuje raspodelu podataka za dati
model, odnosno informa ije u parovima: (xta se moe dogoditi, kolika je mera
mogunosti realiza ije tog dogaÆaja).
Verovatnoa je zasnovana na opxtim znaima o karakteristikama pojave koja je
u fokusu istraivaa, i na osnovu opxtih karakteristika donosi pretpostavke
o pojedinaqnim sluqajevima. Na osnovu saznaa o pojavi, verovatnoa objaxava
xta je mogue, xta nemogue, xta vixe ili mae verovatno.
Na primer, neka je eksperiment ba ae ko ki e (homogena ko ka za igru na
qijim se strani ama nalaze taqki e, od 1 do 6). Izvesno je da e se ko ki a, posle
mogueg kotraa, zaustaviti u stabilnom poloaju tako da se sa ene gore
strane jasno mogu izbrojati taqki e. Praktiqno je neizvodivo da se ko ki a
zaustavi na nekoj od ivi a. Ako ova dva ishoda posmatramo kao dogaÆaje, prvi je
siguran, drugi je nemogu.
U okviru istog eksperimenta kao dogaÆaje moemo posmatrati broj taqki a
koje se nalaze na goroj strani i ko ki e (kae se i "dobijeni broj"). Tada
postoji xest moguih ishoda: dobijen je broj 1,..., dobijen je broj 6, i prisutna je
3
4 POGLAVE 1. VEROVATNOA
nesigurnost u predviÆau rezultata. Ako se pretpostavi da je ko ki a ispravna,
intuitivno je jasno da su svi ishodi jednako verovatni. Kae se, na primer:
verovatnoa da se dobije 4 (da se na goroj strani nalaze qetiri taqki e) iznosi
16. Ili: xansa da se dobije 4 je 16, 67% (
16= 0, 1666). Ili, xto se u svakodnevnom
govoru qesto moe quti: xansa da se dobije 4 je "jedan prema pet", 1 : 5 (1 ishod
je povoan a preostalih 5 nisu).
Elementi teorije verovatnoe koji se razmatraju u ovom poglavu su bazirani
na savremenom pristupu ovoj nau i, koji datira iz tridesetih godina proxlog
veka i qiji je zaqetnik ruski matematiqar Aleksandar Kolmogorov. To su: σ-
algebra dogaÆaja, razliqite defini ije verovatnoe i sluqajne promenive.
1.1 Sluqajni dogaÆaji
Ishod i dogaÆaj su pojmovi koji zavise od eksperimenta koji se sprovodi, pa je to
primarni pojam koji se definixe.
Defini ija 1.1.1 Eksperiment (Verovatnosni eksperiment/opit) je realna
pojava koja se izuqava. To je postupak (pro es) qiji ishod nije unapred poz-
nat, ali je poznato xta sve mogu biti egovi ishodi. Razliqiti ishodi se
realizuju na sluqajan naqin, nezavisno od uslova izvoÆea eksperimenta. Elemen-
tarni dogaÆaj eksperimenta je ishod sprovedenog eksperimenta koji se ne moe
razloiti na jednostavnije dogaÆaje (najqexe je oznaqen sa ω). Prostor ele-
mentarnih dogaÆaja eksperimenta je skup svih egovih elementarnih dogaÆaja i
egova uobiqajena oznaka je Ω.
Prilikom ba aa ko ki e, rezultat je neizvestan u pojedinaqnom ba au, ali
je poznat prostor elementarnih dogaÆaja Ω = ω1, ω2, ω3, ω4, ω5, ω6, gde ωi oznaqava
da se na goroj strani baqene ko ki e nalazi taqno i = 1, 2, . . . , 6 taqaka. Iz
praktiqnih razloga se umesto ωi pixe i. Prilikom ba aa ko ki e, prostor el-
ementarnih dogaÆaja Ω = 1, 2, . . . , 6 ne zavisi od brzine ba aa ko ki e, visinesa koje se ba a, da li se ko ki a ba a u posudu sa vodom,...
Prostor elementarnih dogaÆaja moe imati i beskonaqno elementarnih doga-
Æaja, prebrojivo ili neprebrojivo mnogo.
Primer. Formirae ene. Neka je nabavna ena nekog artikla 2000 dinara,
i neka se zna da se prodajna ena od nabavne sme razlikovati za najvixe 50%.
Eksperiment je formirae prodajne ene (koja zavisi od troxkova transporta i
poreza, potrae artikla,...), a prostor elementarnih dogaÆaja ima neprebrojivo
1.1. SLUQAJNI DOGAAJI 5
mnogo ishoda, i izraava se intervalom realnih brojeva Ω = [2000, 3000].
Defini ija 1.1.2 DogaÆaj (Sluqajni dogaÆaj) A je podskup prostora elemen-
tarnih dogaÆaja, A ⊂ Ω, i on se realizuje u sluqaju da se realizuje neki elemen-
tarni dogaÆaj ω koji se nalazi u podskupu A.
Pri ba au ko ki e, primeri dogaÆaja su:
A = 1, 4, B = 3, 4, 5, 6, C = ∅, D = 1, 2,ali i dogaÆaji koji se mogu definisati opisno:
E - dobijen je paran broj,
F - dobijen je potpun kvadrat prirodnog broja,
G - dobijen je dvo ifren broj,
H - dobijen je broj koji pri deeu sa 3 daje ostatak 1,
J - dobijen je prirodan broj,...
DogaÆaji svakog eksperimenta se posmatraju u odnosu na odgovarajui prostor
elementarnih dogaÆaja, pa se prethodno navedeni dogaÆaji mogu izraziti i ek-
spli itno:
E = 2, 4, 6, F = H = 1, 4, G = ∅, J = Ω.
Ako bi se dogaÆaji E, F,G,H, J posmatrali u okviru eksperimenta izvlaqea
kugli e iz loto-buba, onda bi oni sadrali vixe elementarnih dogaÆaja.
DogaÆaj Ω se uvek realizuje, jer sadri sve mogue ishode, i zato se naziva
siguran dogaÆaj. DogaÆaj ∅ se nikad ne realizuje, jer je ishod eksperimenta nekiod elementarnih dogaÆaja, i naziva se nemogu dogaÆaj.
Proizvoan, opisno zadat dogaÆaj A je nemogu u nekom eksperimentu ako ne
sadri ni jedan elementarni dogaÆaj iz Ω, odnosno ako je A = ∅. A jeste siguran
dogaÆaj ako sadri sve elementarne dogaÆaje, A = Ω.
Kako su dogaÆaji podskupovi od Ω, rela ije meÆu dogaÆajima i opera ije sa
dogaÆajima se definixu na osnovu teorije skupova.
⋄ DogaÆaji A i B su jednaki, A = B, ako svaki elementarni dogaÆaj ω is-
tovremeno obezbeÆuje realiza iju oba dogaÆaja A i B.
⋄ DogaÆaj A impli ira dogaÆaj B, A ⊆ B, ako iz realiza ije dogaÆaja A
sledi realiza ija dogaÆaja B.
⋄ Presek/proizvod dogaÆaja A i B, u ozna i AB = A ·B = A∩B, je dogaÆajkoji se realizuje kada se realizuju i dogaÆaj A i dogaÆaj B. DogaÆaji A i B
su disjunktni/uzajamno iskuqivi ako i samo ako vai AB = ∅.⋄ Unija dogaÆaja A i B, u ozna i A ∪ B, je dogaÆaj koji se realizuje ako se
realizuje bar jedan od dogaÆaja A i B.
⋄ Unija disjunktnih dogaÆaja A i B se naziva zbir dogaÆaja, A+B.
6 POGLAVE 1. VEROVATNOA
⋄ DogaÆaji A i B su meÆusobno suprotni/komplementarni ako vai B =
Ω \ A, odnosno A ∩ B = ∅ i A ∪ B = Ω. Oznaqava se A = B i B = A.
⋄ Razlika dogaÆaja A i B, u ozna i A \B, je dogaÆaj koji se realizuje ako serealizuje dogaÆaj A i ne realizuje se dogaÆaj B. Razlika se moe iskazati
i kao A \B = A ∩B.
Da bi se mogli uporedo analizirati i porediti sluqajni dogaÆaji, potrebno je
ispravno definisati ihovu kolek iju. Kolek ija dogaÆaja koja jeste od interesa
u teoriji verovatnoe se naziva σ−poe dogaÆaja.
Defini ija 1.1.3 σ-poe dogaÆaja za neki prostor elementarnih dogaÆaja Ω je
svaka familija F podskupova od Ω koja ima sledee osobine
1
o Ω ∈ F2
o A ∈ F ⇒ A ∈ F3
o An |n ∈ N = A1, A2, . . . , An, . . . ⊂ F ⇒∞⋃
n=1
An ∈ F
UreÆen par (Ω,F) se naziva prostor dogaÆaja.
Za bilo koje Ω najmae σ-poe je Fmin = ∅,Ω, a najvee je partitivni skup
Fmax = P(Ω), koji sadri sve podskupove od Ω. U opxtem sluqaju, postoji mnogo
σ-poa izmeÆu ih. Na primer, ako je A neprazan pravi podskup od Ω, onda
familija sa qetiri elementa ∅, A, A,Ω jeste σ-poe.Ako je K neka kolek ija podskupova od Ω takva da nije σ-poe, ona se uvek
moe proxiriti do σ-poa. U interesu je da proxirivae bude minimalno, i za
tako dobijeno σ-poe se kae da je indukovano kolek ijom K.
Teorema 1.1.4 Neka je (Ω,F) prostor dogaÆaja, i neka su A,B ∈ F proizvoni
dogaÆaji. Onda AB, A \B i ∅ takoÆe jesu dogaÆaji tog istog poa, odnosno vai
A,B ∈ F ⇒ AB, A \B, ∅ ∈ F .
Ova teorema potvrÆuje da su rezultati primene razliqitih opera ija na dogaÆaje,
takoÆe dogaÆaji.
Od posebne vanosti u teoriji verovatnoe je Borelovo σ-poe, B(R). To
je familija podskupova skupa realnih brojeva R indukovana kolek ijom polu-
otvorenih intervala [a, b), a, b ∈ R. Borelovo σ-poe pored poluotvorenih, sadri
i sve otvorene i sve zatvorene intervale, ihove unije i preseke, kao i jednoele-
mentne skupove a, a ∈ R. Elementi ovog σ-poa se nazivaju Borelovi skupovi.
1.2. VEROVATNOA SLUQAJNOG DOGAAJA 7
1.2 Verovatnoa sluqajnog dogaÆaja
Bie navedene qetiri razliqite defini ije verovatnoe: klasiqna, geometrijska,
statistiqka i aksiomatska. Aksiomatski zasnovana defini ija je, jedina od qe-
tiri navedene, bez ograniqea i sveobuhvatna. Drugim reqima, primeniva je na
sve dogaÆaje i sve eksperimente. Preostale tri defini ije su iskustvene, intu-
itivno prihvativije i znaqajno "starije". MeÆutim, svaka od ih je primeniva
samo pod odreÆenim okolnostima.
1.2.1 Klasiqna defini ija
Ovu defini iju je dao fran uski matematiqar i astronom Pjer Simon Laplas
poqetkom 19.veka. Klasiqna defini ija je najpriblinija naxoj intuitivnoj
predstavi, da verovatnoa predstava odnos "povonog" i "mogueg". Bitno je
prebrojati "povono" i "mogue", pa vanu ulogu ima kombinatorika.
Prilikom ba aa novqia postoje dve mogunosti, da padne pismo ili glava, i
oba ishoda su jednako verovatna. Stoga, verovatnoa svakog elementarnog dogaÆaja
je 0.5.
Osnovne pretpostavke za primenu klasiqne definijije verovatnoe dogaÆaja u
okviru nekog eksperimenta su:
· prostor elementarnih dogaÆaja je konaqan,· svi elementarni dogaÆaji su jednakoverovatni, mogunost realiza ije svakogod ih je podjednaka.
Ako je A dogaÆaj u okviru eksperimenta qiji je prostor elementarnih dogaÆaja Ω,
onda je egova verovatnoa
p(A) =m
n, m = |A|, n = |Ω|. (1.1)
Broj povonih ishoda za realiza iju dogaÆaja A je m, a ukupan broj svih moguÆih
ishoda je n.
Klasiqna defini ija podrava naxu intuitivnu predstavu o nemoguem i
sigurnom dogaÆaju,
p(∅) = 0
n= 0, p(Ω) =
n
n= 1.
Primer. Xahovske figure. Neka se u kutiji nalaze xahovske figure i
neka se eksperiment sastoji u nasumiqnom izvlaqeu jedne figuri e. Klasiqna
defini ija verovatnoe jeste primeiva, jer prostor elementarnih dogaÆaja ima
32 ravnopravna elementa
8 POGLAVE 1. VEROVATNOA
Ω = beli pexak 1, rni pexak 1, . . . , beli pexak 8, rni pexak 8, beli top 1, rni top 1, beli top 2, rni top 2, . . . , beli kra, rni kra.
Neka se posmatraju dogaÆaji:
· A - izvuqena figura je pexak,
· B - izvuqena je rna figura,
· C - izvuqena figura je rni pexak,
· D - izvuqen je beli lova ,
· E - izvuqena je bela dama,
· F - izvuqena figura je plavi kra,
· G - izvuqena je xahovska figura.
Klasiqna defini ija odreÆuje verovatnoe ovih dogaÆaja:
p(A) =16
32, p(B) =
16
32, p(C) =
8
32, p(D) =
2
32,
p(E) =1
32, p(F ) =
0
32= 0, p(G) =
32
32= 1.
Nedostatak ove defini ije su ograniqea sadrana u pretpostavkama. Ona
se ne moe primeniti, na primer, za odreÆivae verovatnoe dogaÆaja u okviru
eksperimenta Formirae ene. Klasiqna defini ija nije primeniva ni u nared-
nom primeru, za odreÆivae verovatnoe pobednika u teniskom mequ, jer mogui
ishodi nisu jednako verovatni.
Primer. Teniski meq. Ako je ishod definisan pobednikom meqa (i pret-
postava se da e meq biti zavrxen), a u mequ uqestvuju teniseri N i R, onda
prostor elementarnih dogaÆaja sadri samo dva elementa,
Ω = pobednik je N, pobednik je R.Verovatnoa da pobedi teniser N nije jednaka odnosu broja povonih i broja
moguih ishoda 0, 5 = 12, nego zavisi od mnogo faktora: forme, rankinga tenisera,
povreda....
1.2.2 Geometrijska defini ija
Geometrijska defni ija verovatnoe je dobar model za eksperimente u kojima je
prostor elementarnih dogaÆaja Ω neprebrojiv, ali se moe predstaviti merivim
skupom taqaka na pravoj, u ravni ili u prostoru. (U opxtem sluqaju, Ω se
moe predstaviti i kao ograniqena oblast u vixedimenzionalnom prostoru Rn.)
Proizvoan dogaÆaj A se takoÆe (kao podskup od Ω) predstava skupom taqaka u
istom prostoru, i egova verovatnoa se definixe kao odnos geometrijskih mera
1.2. VEROVATNOA SLUQAJNOG DOGAAJA 9
(duina, povrxina ili zapremina) skupova A i Ω,
p(A) =m(A)
m(Ω).
Neformalno, broj p(A) je verovatnoa "padaa taqke" u "povoan" deo oblasti
Ω.
Elementarnim dogaÆajem se smatra sluqaj kada je povona oblast svedena na
jednu taqku. Kako taqka nema duinu, niti povrxinu niti zapreminu, vero-
vatnoa elementarnog dogaÆaja je jednaka 0
(
0m(Ω)
)
iako se on moe realizovati.
Primer. Pikado. Ako je meta za pikado krug polupreqnika r, kolika je vero-
vatnoa da pogodak bude blie entru nego obodu mete? (Pretpostavka je da meta
nee biti promaxena!) U ovom eksperimentu je prostor elementarnih dogaÆaja
krug polupreqnika r, Ω = k(r) , a dogaÆaj od interesa se opisuje takoÆe krugom, sa
istim entrom i duplo maim polupreqnikom, A = k(
r2
)
. Verovatnoa dogaÆaja
A je jednaka odnosu povrxina ova dva kruga, slika 1.1.
ΩA
p(A) =( r2)2π
r2π=
1
4.
Slika 1.1: Meta za pikado, naglaxena "povona" oblast
U eksperimentu Formirae ene neka je A dogaÆaj da se prodajna ena artikla
razlikuje od nabavne za 10% − 20%. Onda je oblast koja odgovara dogaÆaju A
interval A = [2200, 2400]. Geometrijska verovatnoa dogaÆaja A je jednaka odnosu
duina intervala
p(A) =2400− 2200
3000− 2000=
200
1000= 0.2.
Geometrijskom verovatnoom se mogu modelovati i negeometrijski problemi.
Primer. Dva izletnika, nezavisno jedan od drugog, dolaze na kontrolnu taqku
izmeÆu 13 i 14 qasova i tu se odmaraju 20 minuta, a zatim nastavaju xetu.
Izraqunati verovatnou da e se izletni i sresti na kontrolnoj taqki.
Izletni i dolaze u vremenskom intervalu od 60 minuta. Ako su momenti
dolazaka izletnika oznaqeni sa x i y, vai 0 ≤ x ≤ 60 i 0 ≤ y ≤ 60. Oblast u
koordinatnoj ravni koja odgovara svim moguim ishodima Ω se moe prikazati
10 POGLAVE 1. VEROVATNOA
kao kvadrat strani e 60, Ω = (x, y) | 0 ≤ x, y ≤ 60. Susret e biti ostvaren akosu momenti dolazaka na maem rastojau od 20 minuta, |x − y| ≤ 20. Oblast u
ravni koja odgovara realiza iji susreta je A = (x, y) ∈ Ω | y ∈ (x − 20, x + 20),skup taqaka izmeÆu pravih y = x− 20 i y = x+ 20. Verovatnoa susreta se moe
iskazati odnosom povrxina odgovarajuih figura, kao na sli i 1.2.
x
y
0 20 60
20
60
p(A) =602 − 402
602=
5
9.
Slika 1.2: Geometrijski model susreta izletnika
1.2.3 Statistiqka defini ija
Ova defini ija je iskustvena, posledi a je intenzivnog posmatraa, ponavaa
nekog eksperimenta. Naziva se jox i empirijska defini ija.
Neka je n broj ponavaa eksperimenta i n(A) broj eksperimenata u kojima
se realizovao proizvoan dogaÆaj A. Odnos
n(A)
nje relativna frekven-
ija/uqestalost dogaÆaja A. U ponovenoj seriji izvoÆea istog eksperimenta,
relativna frekven ija istog dogaÆaja moe biti drugaqija, ali sa porastom broja
ponavaa eksperimenta (n → ∞) relativne frekven ije se grupixu, odnosno
tee ka istom broju koji se naziva verovatnoa dogaÆaja A,
p(A) = limn→∞
n(A)
n.
Ko ki a za igru se smatra ispravnom ako su verovatnoe svih 6 elementarnih
dogaÆaja meÆusobno jednake, iznose
16. ena ispravnost se proverava primenom
statistiqke defini ije verovatnoe. Ko ki a se ba a mnogo puta (na primer
100000 puta) i posmatra se relativna uqestalost svakog pojedinaqnog elemen-
tarnog dogaÆaja.
Primer. Analiza radnog statusa udi od 20 do 30 godina starosti. Poje-
dina moe biti zaposlen u dravnoj slubi, u privatnom sektoru ili neza-
1.2. VEROVATNOA SLUQAJNOG DOGAAJA 11
poslen. (Ovo su tri elementarma dogaÆaja.) Ci je da se odredi verovatnoa da
je sluqajno odabrana osoba u nekoj od tri kategorije. Eksperiment je anketirae
10000 udi, a zatim se odreÆuju relativne frekven ije svake kategorije. Rezul-
tat istraivaa bi mogao da glasi: verovatnoa da je sluqajno odabrana osoba
zaposlena u dravnoj slubi je 0.32, verovatnoa da je zaposlena u privatnom
sektoru je 0.57 i verovatnoa da je osoba nezaposlena je 0.11. Napomena: ovo je
primer raspodele verovatnoe, o kojoj e kasnije biti vixe reqi.
Primer. Teniski meq. U ve pomenutom primeru, verovatnoe pobeda oba te-
nisera se ne mogu odrediti primenom statistiqke defini ije, qak iako su oni
ve odigrali veliki broj meqeva. Statistiqki model verovatnoe nije pouzdan,
jer na ishod predstojeeg meqa utiqe vixe faktora.
1.2.4 Aksiomatska defini ija
Prethodne tri defini ije imaju svoja ograniqea i ne mogu biti primeene
u okviru proizvonog eksperimenta. Defini ija koja e biti dovono opxteg
karaktera je apstraktna, zasnovana na aksiomama, i bez ikakvih pretpostavki o
eksperimentu ili egovim ishodima.
Eksperiment, sam po sebi, definixe prostor elementarnih dogaÆaja Ω, a do-
gaÆaji koji su od interesa pripadaju nekom σ-pou F . Verovatnoa je funk ijakoja svakom dogaÆaju iz σ-poa dodeuje brojnu vrednost - meru mogunosti egove
realiza ije.
Defini ija 1.2.1 Neka je (Ω,F) prostor dogaÆaja. Funk ija P : F → R se
naziva verovatnoa, ako zadovoava sledee tri aksiome:
1
o
(Normiranost) Verovatnoa sigurnog dogaÆaja jeste 1
P (Ω) = 1
2
o
(Nenegativnost) Verovatnoa svakog dogaÆaja je nenegativna
A ∈ F ⇒ P (A) ≥ 0
3
o
(Aditivnost) Ako je An |n ∈ N ⊂ F niz po parovima disjunktnih do-
gaÆaja, onda je verovatnoa ihove unije jednaka zbiru verovatnoa svih
dogaÆaja
( An|n ∈ N ⊂ F ∧ Ai ∩ Aj = ∅, i 6= j ) ⇒ P
(
⋃
n∈NAn
)
=∑
n∈NP (An).
12 POGLAVE 1. VEROVATNOA
UreÆena trojka (Ω,F , P ) se naziva prostor verovatnoe.
Moe se pokazati da ove tri osobine funk ije P obezbeÆuju sve osobine koje
intuitivno oqekujemo od verovatnoe, xto potvrÆuje i sledea teorema.
Teorema 1.2.2 Neka je (Ω,F , P ) prostor verovatnoe i neka su A, B i An |n ∈N proizvoni dogaÆaji u σ-pou F . Vae sledea tvrÆea:
1. P (∅) = 0, verovatnoa nemogueg dogaÆaja je 0.
2. (Konaqna aditivnost)
Ako je A1, A2, . . . , Ak konaqan skup po parovima disjunktnih dogaÆaja, onda
P (A1 + A2 + . . .+ Ak) = P (A1) + P (A2) + . . .+ P (Ak).
3. P(
A)
= 1− P (A), verovatnoe suprotnih dogaÆaja se dopuuju do 1.
4. A ⊆ B ⇒ P (A) ≤ P (B), verovatnoa je monotona funk ija.
5. P (A) ∈ [0, 1], verovatnoa je ograniqena funk ija.
6. P (A ∪ B) = P (A) + P (B)− P (AB)
7. (Lema o pokrivau)
P
(
⋃
n∈NAn
)
≤∑
n∈NP (An)
8. (Neprekidnosti verovatnoe)
Neprekidnost odozgo: A1⊆A2⊆· · ·⊆An⊆· · · ⇒ P
(
⋃
n∈NAn
)
= limn→∞
P (An)
Neprekidnost odozdo: A1⊇A2⊇· · ·⊇An⊇· · · ⇒ P
(
⋂
n∈NAn
)
= limn→∞
P (An)
Dokaz. Provera svih tvrÆea se zasniva na aksiomama iz defini ije verovatnoe
i osobinama skupovnih opera ija.
1. Siguran dogaÆaj se moe zapisati kao prebrojiva unija Ω = Ω + ∅ + ∅ + · · ·odakle primenom aditivnosti sledi P (Ω) = P (Ω) + P (∅) + P (∅) + · · · .Nenegativnost funk ije P garantuje da je P (∅) = 0.
2. Skup A1, A2, . . . , Ak se moe proxiriti do niza A1, A2, . . . , Ak, ∅, ∅, . . . , paje na osnovu aditivnosti
P (A1 + A2 + . . .+ Ak + ∅+ . . . ) = P (A1) + P (A2) + . . .+ P (Ak) + P (∅) + . . . ,
odakle primenom prvog tvrÆea sledi konaqna aditivnost.
3. Za proizvoan dogaÆaj A vai A ∪ A = Ω, odakle sledi P(
A ∪ A)
= P (Ω).
Kako su A i A suprotni dogaÆaji, oni su i disjunktni pa se po konaqnoj adi-
tivnosti leva strana jednaqine moe napisati u obliku zbira verovatnoa P (A)+
1.2. VEROVATNOA SLUQAJNOG DOGAAJA 13
P(
A)
= P (Ω). Na osnovu aksiome normiranosti, desna strana jednaqine ima vred-
nost 1. Dakle, vai P (A) + P(
A)
= 1, odakle sledi tvrÆee.
4. Iz uslova sledi da se B moe napisati u obiku zbira dogaÆaja B = A + AB,
kao i egova verovatnoa P (B) = P (A) + P(
AB)
. Poxto su sve verovatnoe
nenegativne, vrednost zbira jeste vea nego vrednost pojedinog sabirka, pa je
P (B) ≥ P (A).
5. Za svaki dogaÆaj A vai ∅ ⊆ A ⊆ Ω, pa se primenom prethodnog, dobija
tvrÆee.
6. Za proizvone dogaÆaje A i B vai A ∪ B = A + (B \ A), B = AB + (B \ A),i dae na osnovu aditivnosti verovatnoe P (A ∪ B) = P (A) + P (B \ A), P (B) =
P (AB)+P (B \A). Zamenom vrednosti P (B \A) iz druge jednaqine u prvu, dobijase tvrÆee.
Provere 7. i 8. tvrÆea zahtevaju boe poznavae teorije skupova i topologije,
pa su izostavene.
Verovatnoa nemogueg dogaÆaja je jednaka nuli, a ako je dogaÆaj siguran onda je
egova verovatnoa jednaka 1. Ako je sluqajni dogaÆaj razliqit od sigurnog doga-
Æaja, a egova verovatnoa je jedaka 1, onda se on naziva skoro siguran dogaÆaj.
Ako je sluqajni dogaÆaj razliqit od nemogueg dogaÆaja, a egova verovatnoa je
jedaka 0, onda se on naziva skoro nemogu dogaÆaj. DogaÆaj qija je verovatnoa
razliqita od nule se naziva ostvariv dogaÆaj.
Kada su u pitau eksperimenti sa konaqno mnogo elementarnih ishoda, onda je
prostor verovatnoe potpuno odreÆen verovatnoama elementarnih dogaÆaja koje
se mogu zapisati i xematski, u vidu raspodele verovatnoa (o kojoj e kasnije biti
vixe reqi). Verovatnoe elementarnih dogaÆaja jednoznaqno odreÆuju verovatnou
svakog dogaÆaja.
Primer. Ba ae ko ki e. Prilikom ba aa ko ki e mogu se razmatrati raz-
liqiti prostori verovatnoa, zavisno od toga koji su dogaÆaji od interesa. Ali
funk ija verovatnoe je odreÆena raspodelom verovatnoa elementarnih dogaÆaja.
Ako je u pitau pravilna ko ki a, verovatnoe elementarnih dogaÆaja su
P (1) = P (2) = P (3) = P (4) = P (5) = P (6) =1
6,
a odgovarajua raspodela verovatnoa se zapisuje u sledeem obliku
(
1 2 3 4 5 616
16
16
16
16
16
)
. (1.2)
14 POGLAVE 1. VEROVATNOA
1
o
Neka je T dogaÆaj da je pri ba au ko ki e dobijen broj deiv sa 3, T =
3, 6. Taj dogaÆaj indukuje σ-poe
F1 = ∅, T, T ,Ω.
Na osnovu raspodele verovatnoa (1.2) je jasno kako izgleda funk ija vero-
vatnoe,
P : F1 → [0, 1], P (∅) = 0, P (T ) =2
6, P (T ) =
4
6, P (Ω) = 1.
2
o
Ako se posmatraju dogaÆaji P - dobijen je prost broj, i S - dobijen je sloen
broj, onda indukovano σ-poe F2 pored dogaÆaja P = 2, 3, 5 i S = 4, 6sadri jox dogaÆaja. Ako se obelei i dogaÆaj J = 1, onda je P = S ∪ J ,
S = P ∪ J , J = P ∪ S, i dae
F2 = ∅,Ω, P, S, J, P , S, J.
Funk ija verovatnoe je
P : F1 → [0, 1], P (∅) = 0, P (Ω) = 1, P (P ) = 36,
P (S) = 26, P (J) = 1
6, P
(
P)
= 36, P
(
S)
= 46, P
(
J)
= 56.
3
o
Maksimalno σ-poe F = P(Ω) ima 26 = 64 dogaÆaja i nije praktiqno ispi-
sivati ihove verovatnoe. Jednostavno se na osnovu raspodele verovatnoa
(1.2) izraqunaju verovatnoe onih dogaÆaja koji su od interesa.
4
o
Ako ko ki a nije ispravna, onda se verovatnoa u prostoru dogaÆaja (Ω,F1)
moe zadati ili odrediti na drugi naqin, na primer empirijski (primenom
statistiqke defini ije, nakon 10000 ba aa),
P1 : F1 → [0, 1], P1(∅) = 0, P1(Ω) = 1, P1(T ) = 0.28, P1(T ) = 0.72.
5
o
U nastavku e biti od interesa σ-poe indukovano ve pomenutim dogaÆajima
P , S, T i dogaÆajem D = 2, 4, 6 - dobijen je broj deiv sa 2. Ono sadri
mnogo dogaÆaja, i nije neophodno odrediti unapred verovatnou svakog od
ih. Po potrebi, a na osnovu verovatnoa elementarnih dogaÆaja, raqunaju
se verovatnoe, na primer:
P (D) = 12, P (P ∪D) = 5
6, P (D ∩ T ) = 1
6, ...
Napomena. Za dogaÆaje T i T u prvom i qetvrtom sluqaju, kao i za P , S i J
u drugom sluqaju se kae da qine potpun sistem dogaÆaja, jer razbijaju prostor
elementarnih dogaÆaja na disjunktne skupove.
Primer. Xahovske figure. Nakon uvoÆea aksiomatske defini ije vero-
vatnoe, ovaj eksperiment se moe posmatrati i na sledei naqin, da prostor
1.3. USLOVNA VEROVATNOA 15
elementarnih dogaÆaja ima samo 12 elemenata ali da su ihove verovatnoe ra-
zliqite,
(
pb pc tb tc sb sc lb lc kb kc db dc14
14
116
116
116
116
116
116
132
132
132
132
)
. (1.3)
Verovatnoa dogaÆaja "izvuqena figura je bela i moe pravolinijski da preskaqe
vixe od dva poa" se dobija kao zbir
116
+ 116
+ 132
= 532, (lova , top i dama).
Napomena: U prethodnim primerima je zbir verovatnoa elementarnih doga-
Æaja jednak 1! To je vana osobina raspodele verovatnoa, o kojoj e kasnije biti
vixe reqi.
1.3 Uslovna verovatnoa
1.3.1 Uslovna verovatnoa i nezavisnost dogaÆaja
Verovatnoa nekog dogaÆaja u okviru proizvonog eksperimenta moe vixe ili
mae zavisiti od realiza ije nekog drugog dogaÆaja. Ako realiza ija nekog doga-
Æaja ne utiqe na mogunost realiza ije drugog dogaÆaja, onda su oni nezavisni.
Primer. Ba ae ko ki e. Ako sa zna da je dobijen paran broj (deiv sa 2),
kolika je verovatnoa da je dobijeni broj deiv sa 3? Zna se da je ostvaren neki
od elementarnih dogaÆaja 2, 4, 6, a kako se meÆu ima nalazi samo jedan deiv
trojkom, traena verovatnoa je jednaka
13. Ako je dobijen paran broj, kolika je
verovatnoa da je on sloen? Kako se meÆu parnim dobijenim brojevima nalaze
dva sloena, traena verovatnoa je
23. Ako je dobijen sloen broj, kolika je
verovatnoa da je on deiv sa 2? A sa 3? Kako su oba sloena broja deiva sa 2,
odgovor na prvo pitae je 1. Analogno, verovatnoa da je dobijeni sloeni broj
deiv sa 3 iznosi
12.
Ovo su primeri uslovnih verovatnoa, i za ih se uvode posebne oznake,
P (T |D) =1
3, P (S|D) =
2
3, P (D|S) = 1, P (T |S) = 1
2.
Defini ija 1.3.1 Neka su A i B dogaÆaji u prostoru verovatnoe (Ω,F , P ), i
neka je B ostvariv, tj. P (B) 6= 0. Verovatnoa dogaÆaja A pod uslovom da se
realizovao dogaÆaj B se naziva uslovna verovatnoa i jednaka je
P (A|B) =P (AB)
P (B). (1.4)
16 POGLAVE 1. VEROVATNOA
Uslovna verovatnoa P (A|B) pokazuje koji "deo" dogaÆaja A je obuhvaen do-
gaÆajem B, slika 1.3.
Ω
BA
Slika 1.3: Geometrijska interpreta ija uslovne verovatnoe: razmatra se A ali
se umesto Ω posmatra B.
U terminima geometrijske verovatnoe, uslovna verovatnoa P (A|B) je odnos
povrxine preseka dogaÆaja A ∩ B i povrxine dogaÆaja B. Kako je pretpostavka
da se B ostvario, vixe nije aktuelan qitav prostor elementarnih dogaÆaja, nego
samo ono xto je unutar dogaÆaja B.
U skladu sa defini ijom, mogu se proveriti uslovne verovatnoe iz pret-
hodnog primera. Proizvodi odgovarajuih dogaÆaja su TD = 6, SD = 4, 6,TS = 6. Primenom defini ije (1.4) dobija se
P (T |D) =P (TD)
P (D)=
1612
=1
3,
i analogno
P (S|D) =2612
=2
3, P (D|S) =
2613
= 1, P (T |S) =1613
=1
2.
Jednakost verovatnoa P (T |D) = P (T ) pokazuje da qieni a da je dobijeni
broj paran ne utiqe na dogaÆaj "dobijeni broj je deiv sa 3".
Sa druge strane, sloenost dobijenog broja i parnost dobijenog broja su do-
gaÆaji koji imaju meÆusobnog uti aja. TakoÆe, sloenost dobijenog broja utiqe na
egovu deivost trojkom.
Defini ija 1.3.2 Neka su sluqajni dogaÆaji A i B iz istog prostora vero-
vatnoe (Ω,F , P ) i neka je B ostvariv. DogaÆaji A i B su nezavisni ako je
P (A|B) = P (A).
Teorema 1.3.3 Ako je (Ω,F , P ) prostor verovatnoe i B ostvariv dogaÆaj u tom
prostoru, P (B) > 0, onda uslovna verovatnoa
P (A|B) =P (AB)
P (B), A ∈ F ,
takoÆe jeste funk ija verovatnoe.
1.3. USLOVNA VEROVATNOA 17
Dokaz. Proveravaju se aksiome iz defini ije verovatnoe:
1. Uslov nenegativnosti vai jer je uslovna verovatnoa koliqnik nenegativnog
i pozitivnog broja.
2. Primenom defini ije uslovne verovatnoe na prostor elementarnih dogaÆaja,
a imajui u vidu Ω · B = B, dobija se potvrda normiranosti,
P (Ω|B) =P (ΩB)
P (B)=
P (B)
P (B)= 1.
Ako je An |n ∈ N proizvoan niz disjunktnih dogaÆaja, onda i odgovarajui
prese i AnB |n ∈ N takoÆe qine niz disjunktnih dogaÆaja. TakoÆe je jasno
(∪∞n=1An) ∩ B = ∪∞n=1AnB. Primenom aksiome aditivnosti verovatnoe P , dobija
se
P
( ∞∑
n=1
An|B)
=
P
( ∞∑
n=1
AnB
)
P (B)=
∞∑
n=1
P (AnB)
P (B)
=∞∑
n=1
P (AnB)
P (B)=
∞∑
n=1
P (An|B).
Teorema 1.3.4 Neka su A i B proizvoni dogaÆaji istog prostora verovatnoe
(Ω,F , P ). Onda vae sledea tvrÆea:
1. Ostvarivi dogaÆaji su nezavisni ako i samo ako je
P (AB) = P (A) · P (B). (1.5)
2. Ako dogaÆaji nisu nezavisni i A je ostvariv, onda je
P (AB) = P (A) · P (B|A). (1.6)
3. DogaÆaj A i siguran dogaÆaj su nezavisni.
4. DogaÆaj A i nemogu dogaÆaj su nezavisni.
5. Ako su dogaÆaji nezavisni onda su nezavisni po parovima i A i B, A i B,
A i B.
6. Ako su dogaÆaji nezavisni i ostvarivi, onda oni nisu disjunktni.
7. Ako su dogaÆaji ostvarivi i disjunktni, onda oni nisu nezavisni.
Dokaz.
1. Ako su dogaÆaji nezavisni onda je P (A) = P (A|B) = P (AB)P (B)
, pa se mnoeem jed-
naqine sa P (B) dobija tvrÆee. Obrnuto, uvrxtavaem jednakosti u defini iju
uslovne verovatnoe dobija se P (A|B) = P (A)P (B)P (B)
= P (A), odakle sledi nezavis-
nost.
18 POGLAVE 1. VEROVATNOA
2. Trivijalno.
3. Kako je A ⊂ Ω, to je AΩ = A, pa su i verovatnoe tih dogaÆaja jednake. A i Ω
su nezavisni jer je
P (A|Ω) = P (A)
P (Ω)= P (A).
4. Verovatnoa nemogueg dogaÆaja ∅ je 0, pa je i P (A∅) = P (∅) = 0. A je ostvariv
dogaÆaj, odakle P (∅|A) = 0P (A)
= 0, pa je P (∅) = P (∅|A), xto dokazuje nezavisnost.5. Na osnovu aditivnosti uslovne verovatnoe i nezavisnosti dogaÆaja A i B je
1 = PB(Ω) = PB(A + A) = PB(A) + PB
(
A)
= P (A) + PB
(
A)
,
odakle sledi P(
A|B)
= 1−P (A) = P(
A)
, odnosno nezavisnost dogaÆaja A i B.
Analogno se proverava i nezavisnost dogaÆaja A i B.
Provera nezavisnosti dogaÆaja A i B se svodi na proveru uslova (1.5). Komple-
ment preseka skupova je jednak uniji ihovih komplemenata, pa na osnovu osobina
funk ije verovatnoe vai
P (AB) = P (A ∪ B) = 1− P (A ∪ B) = 1− P (A)− P (B) + P (AB)
= P (A)− P (B) + P (AB) = P (A)− P (B) + P (A)P (B)
= P (A)− P (B)(1− P (A)) = P (A)− P (B)P (A) = P (A)(1− P (B))
= P (A)P (B).
6. Ako su dogaÆaji nezavisni i ostvarivi, vai P (AB) = P (A)P (B), i P (A) > 0,
P (B) > 0. Ako se pretpostavi da su dogaÆaji A i B disjunktni, onda je P (AB) = 0,
pa se dobija 0 = P (A)P (B), xto je u kontradik iji sa ostvarivoxu dogaÆaja.
7. Na osnovu pretpostavki je P (A) > 0, P (B) > 0 i AB = ∅, odakle P (A|B) =0
P (B)= 0 6= P (A), pa dogaÆaji nisu nezavisni.
Napomene:
· Uslov (1.5) se qesto uzima i za defini iju pojma nezavisnosti dogaÆaja.· TvrÆea 1 i 2 prethodne teoreme, odnosno rela ije (1.5) i (1.6) obezbeÆuju izraqu-navae verovatnoe preseka dva dogaÆaja.
· Zavisnost, odnosno nezavisnost meÆu ostvarivim dogaÆajima jeste uzajamna. Do-
gaÆaj A ne zavisi od dogaÆaja B ako i samo ako je
P (A) = P (A|B) ⇔ P (AB) = P (A)P (B) ⇔ P (B) = P (B|A).
Primer. Na raspolagau su ko ki a za igru i kutija u kojoj je 9 kugli a, xest
oznaqenih brojem 1 i tri oznaqene brojem 2. Ba a se ko ki a i izvlaqi se jedna
kugli a iz kutije. Kolika je verovatnoa da zbir dobijenih brojeva bude 5? A 8?
1.3. USLOVNA VEROVATNOA 19
Pet se dobija ako je na ko ki i dobijeno 4 i na kugli i 1 (presek dva dogaÆaja),
ili ako je na ko ki i dobijeno 3 a na kugli i 2 (ponovo presek dva dogaÆaja).
Jasno je da su ba ae ko ki e i izvlaqee kugli e nezavisni dogaÆaji, pa se ve-
rovatnoe preseka mogu iskazati kao proizvodi odgovarajuih verovatnoa,
P (5) = P(4) · P(1) + P(3) · P(2) =16· 69+ 1
6· 39= 1
6,
gde P i P jesu oznake verovatnoa dobijenih brojeva ba aem ko ki e i izvla-
qeem kugli e, respektivno. Zbir 8 se dobija jedino ako je na ko ki i dobijeno
6 a na kugli i 2, pa je
P (8) = P(6) · P(2) =16· 39= 1
18.
Pojam nezavisnosti se moe uopxtiti razmatraem veeg broja dogaÆaja. Do-
gaÆaji A1,A2, . . ., An su nezavisni po parovima ako za svaka dva dogaÆaja vai
jednakost analogna (1.5). DogaÆaji A1,A2, . . ., An su nezavisni u ukupnosti ako za
svako 2 ≤ k ≤ n i svaki izbor indeksa i1, i2, . . . , ik ⊂ 1, 2, . . . , n vai
P (Ai1Ai2 · . . . · Aik) = P (Ai1)P (Ai2) · . . . · P (Aik).
Tako, nezavisnost tri dogaÆaja A, B i C podrazumeva sledee qetiri jednakosti:
P (AB) = P (A)P (B), P (AC) = P (A)P (C),
P (BC) = P (B)P (C), P (ABC) = P (A)P (B)P (C).
U suprotnom, ako dogaÆaji nisu u potpunosti nezavisni, verovarnoa preseka je
P (ABC) = P (A)P (B|A)P (C|AB).
Analogno, verovatnoa proizvoda proizvono dogaÆaja je
P (A1A2 · · ·An) = P (A1)P (A2|A1)P (A3|A1A2) · · ·P (An|A1A2 · · ·An−1).
Nezavisnost dogaÆaja se retko proverava defini ijom, obiqno se utvrÆuje na
osnovu okolnosti samog eksperimenta, xto potvrÆuje i sledei primer.
Primer. Formirae broja. U kutiji su 4 kartona sa napisanim iframa
1,2,3,4. Eksperiment je sledei: iz kutije se izvlaqi jedan po jedan karton (bez
vraaa) sve dok se od izvuqenih ifara ne formira neparan broj. Prostor
elementarnih dogaÆaja je
Ω = 1, 3, 21, 23, 41, 43, 241, 243, 421, 423.Jasno je da P (1) = P (3) = 1
4. Verovatnoe ostalih elementarnih dogaÆaja se
raqunaju. Na primer, formirae broja 241 podrazumeva da su se realizovani
redom dogaÆaji: I - u prvom izvlaqeu 2, II - u drugom izvlaqeu 4, III - u
20 POGLAVE 1. VEROVATNOA
treem izvlaqeu 1. Ovde II zavisi od I i III zavisi od I ∩ II:
I = 2 - na prvom izvuqenom kartonu je ifra 2, P (I = 2) = 14,
II = 4 - na drugom izvuqenom kartonu je ifra 4, P (II = 4|I = 2) = 13(izvlaqi se
jedan od tri kartona),
III = 1 - na treem izvuqenom kartonu je ifra 1, P (III = 1|I = 2, II = 4) = 12
(ve su izvuqeni 2 i 4, ostala su samo dva kartona), pa se dobija:
P (241) = P (I = 2)P (II = 4|I = 2)P (III = 1|I = 2, II = 4) = 14· 1
3· 1
2= 1
24.
Analognim raqunaem se dobija sledea raspodela verovatnoa
(
1 3 21 23 41 43 241 243 421 42314
14
112
112
112
112
124
124
124
124
)
. (1.7)
Maksimalno σ-poe u okviru ovog eksperimenta ima 1024 dogaÆaja, i verovatnoa
svakog pojedinaqno moe biti izraqunata na osnovu raspodele verovatnoa i oso-
bina funk ije verovatnoe. Razmatraju se samo neki dogaÆaji i ihove vero-
vatnoe:
· C1 oznaqava dogaÆaj da je posleda ifra u formiranom broju 1. C3 oznaqava
dogaÆaj da je posleda ifra u formiranom broju 3. Ova dva dogaÆaja su
suprotna i disjunktna i qine potpun sistem dogaÆaja. ihove verovatnoe
su
P (C1) =1
2, P (C3) =
1
2.
· Posmatraju se dogaÆaji po broju ifara u formiranom broju: jedno if-
reni J = 1, 3, dvo ifreni D = 21, 23, 41, 43 i tro ifreni brojevi T =
241, 243, 421, 423. Ova tri dogaÆaja takoÆe qine potpun sistem, a odgo-
varajue verovatnoe su
P (J) =1
2, P (D) =
1
3, P (T ) =
1
6,
gde su verovatnoe izraqunate na osnovu (1.7).
· S je dogaÆaj da je formirani broj sloen, S = 21, 243, 423, a egova vero-vatnoa je P (S) = 1
6.
Ako je broj formiran, i dvo ifren je, kolika je verovatnoa da je on i sloen?
Ovo znaqi da se realizovao jedan od qetiri elementarna dogaÆaja (koji su ravno-
pravni, imaju iste verovatnoe), a kako je samo jedan od dvo ifrenih brojeva
sloen, onda je traena verovatnoa jednaka
14. Isto se dobija i razmatraem
uslovne verovatnoe,
P (S|D) =P (21)P (D)
=11213
=1
4.
1.3. USLOVNA VEROVATNOA 21
Ako je formirani broj dvo ifren, verovatnoa da se zavrxava ifrom 3 jeste
P (C3|D) = 12.
Ako se zna da je posleda ifra formiranog broja 1, koliko je verovatno da je on
tro ifren? Ovaj dogaÆaj je realizovan ako je prva izvuqena ifra bila 2 ili 4,
druga izvuqena ifra je preostala parna, a trea izvuqena ifra se zna da je 1.
Verovatnoa dogaÆaja je
2413= 1
6. Ili
P (T |C1) =P (241, 421)
P (C1)=
22412
=1
6.
Ako je formirani broj sloen, kolika je verovatnoa da je on jedno ifren? Kako
nema jedno ifrenih sloenih brojeva, jasno je da je ova verovatnoa jednaka 0,
P (J |S) = 0.
1.3.2 Formula totalne verovatnoe i Bajesova formula
Ove formule se koriste u sluqaju kada se sloen dogaÆaj moe razloiti na
vixe disjunktnih dogaÆaja indukovanih nekim razbijaem (parti ijom) prostora
elementarnih dogaÆaja.
Primer. Stran i. Na parkingu autoputa se nalazi 156 strana a iz tri drave
koji su doputovali autobusima iz MaÆarske, Rumunije i Bugarske. Razmatra se
dogaÆaj E, da sluqajno odabrana osoba govori engleski. Ovde prostor elemen-
tatnih dogaÆaja Ω ima 156 elemenata. Za izraqunavae verovatnoe dogaÆaja E
potrebno je jox informa ija. Sistemi xkolovaa u tri susedne drave su takvi
da po zavrxetku xkolovaa 70% MaÆara, 50% Rumuna i 80% Bugara govori en-
gleski. Jox je potrebno znati broj strana a iz svake drave. MaÆara ima 42,
Rumuna 54 i Bugara 60. DogaÆaji M - sluqajno odabrana osoba je iz MaÆarske,
R - sluqajno odabrana osoba je iz Rumunije i B - sluqajno odabrana osoba je iz
Bugarske su meÆusobno disjunktni i qine jedno razbijae skupa Ω. Verovatnoe
kojima raspolaemo se mogu izraziti ekspli itno,
P (E|M) = 0.7, P (E|R) = 0.5, P (E|B) = 0.8,
P (M) =42
156, P (R) =
54
156, P (B) =
60
156.
Razbijae skupa strana a je prikazano na sli i 1.4.
DogaÆaj E se razlae na sledei naqin
E = E ∩ Ω = E ∩ (M ∪ R ∪ B) = EM ∪ ER ∪ EB = EM + ER + EB,
22 POGLAVE 1. VEROVATNOA
Ω
E
B
M
R
Slika 1.4: Uti aj razbijaa skupa strana a na dogaÆaj E
pa se i egova verovatnoa izraava zbirom P (E) = P (EM) + P (ER) + P (EB).
Dae, verovatnoe proizvoda iskazuju se uslovnim verovatnoama i dobija se
brojni izraz i traena verovatnoa
P (E) = P (M)P (E|M) + P (R)P (E|R) + P (B)P (E|B) ≈ 0.67.
Ako sluqajno odabrana osoba govori engleski, koliko je verovatno da je iz Bugarske?
Ovo je pitae zavisnosti dogaÆaja B od dogaÆaja E, pa se tako i raquna, imajui
u vidu poqetne informa ije,
P (B|E) =P (EB)
P (E)=
P (B)P (E|B)
P (M)P (E|M) + P (R)P (E|R) + P (B)P (E|B)≈ 0.46.
DogaÆajiM , R iB qine potpun sistem dogaÆaja/hipoteza M,R,B. Za izraqu-navae verovatnoe dogaÆaja E korixena je formula totalne verovatnoe, a
uslovna verovatnoa P (B|E) je dobijena na osnovu Bajesove formule. Ovi poj-
movi postoje nezavisno od eksperimenta, pa se definixu u okviru proizvonog
prostora verovatnoe, (Ω,F , P ).
Defini ija 1.3.5 Neka ostvarivi dogaÆaji H1, H2, . . .,Hn razbijaju prostor
elementarnih dogaÆaja Ω, odnosno neka vai:
1
o P (Hi) > 0, i = 1, . . . , n,
2
o H1 ∪H2 ∪ . . . ∪Hn = Ω,
3
o Hi ∩Hj = ∅, za i 6= j, i, j ∈ 1, 2, . . . , n,Skup H1, H2, . . . , Hn se naziva potpun sistem dogaÆaja/hipoteza.
Potpun sistem dogaÆaja se formira tako da olakxa (ili omogui) izraquna-
vae verovatnoe proizvonog dogaÆaja A, ali podrazumeva da su verovatnoe hi-
poteza poznate (ili lako izraqunive) P (Hi) i nazivaju se apriorne verovatnoe.
TakoÆe, mora da vai P (H1) + P (H2) + . . .+ P (Hn) = 1.
Teorema 1.3.6 (Formula totalne verovatnoe) Neka je H1, H2, . . . , Hn potpunsistem hipoteza u prostoru verovatnoe (Ω,F , P ), i neka je A ∈ F . Onda se
1.4. SLUQAJNE PROMENIVE 23
verovatnoa dogaÆaja A moe izraziti na sledei naqin
P (A) =n∑
i=1
P (Hi)P (A|Hi). (1.8)
Dokaz. DogaÆaj A se razlae u obliku zbira disjunktnih dogaÆaja indukovanih
potpunim sistemom hipoteza
A = A ∩ Ω = A ∩ (H1 ∪H2 ∪ . . . ∪Hn) = AH1 ∪AH2 ∪ . . . ∪ AHn,
pa se i egova verovatnoa moe iskazati u vidu zbira,
P (A) = P (AH1) + P (AH2) + . . .+ P (AHn),
Kada se verovatnoa svakog preseka AHi izrazi uslovnom verovatnoom P (AHi) =
P (Hi)P (A|Hi), dobija se formula totalne verovatnoe.
Uslovna verovatnoa P (Hi|A) daje informa iju unazad, kada je dogaÆaj A real-
izovan, koliko je verovatno da je to posledi a bax hipoteze Hi, i zato se naziva
aposteriorna verovatnoa.
Teorema 1.3.7 (Bajesova formula) Neka je H1, H2, . . . , Hn potpun sistem hi-
poteza u prostoru verovatnoe (Ω,F , P ), i neka je A ∈ F ostvariv dogaÆaj,
P (A) > 0. Onda su aposteriorne verovatnoe
P (Hi|A) =P (Hi)P (A|Hi)
∑n
j=1 P (Hj)P (A|Hj), i = 1, 2, . . . , n. (1.9)
Dokaz. Za proizvonu hipotezu Hi je uslovna verovatnoa
P (Hi|A) =P (AHi)
P (A)=
P (Hi)P (A|Hi)
P (A).
Zamenom verovatnoe dogaÆaja A formulom totalne verovatnoe, dobija se Ba-
jesova formula.
1.4 Sluqajne promenive
Sluqajne promenive su funk ije koje elementarnim dogaÆajima dodeuju realne
brojeve. Rezultati eksperimenta su opisani realnom funk ijom koja ima odreÆene
osobine i qitavu strukturu prostora verovatnoe prenosi u skup realnih brojeva.
24 POGLAVE 1. VEROVATNOA
UvoÆee sluqajnih promenivih je motivisano, pre svega, qieni om da se
ne mogu uvek elementarni dogaÆaji pre izno matematiqki opisati. TakoÆe, prak-
tiqno je u opisu eksperimenta koristiti brojeve za identifika iju elementarnih
dogaÆaja. Dae, razliqiti eksperimenti mogu imati istu "verovatnosnu struk-
turu". Konaqno, kompletan raqun je zasnovan na teoriji skupova, xto nekad moe
biti komplikovano.
Neformalno je ve korixen pojam sluqajne promenive. U eksperimentu ba-
ae ko ki e, jedan od elementarnih dogaÆaja je "sa gore strane ko ki e se
nalazi 5 taqki a", meÆutim odmah je uveden skraeni opis "dobili smo 5", a
u prostoru elementarnih dogaÆaja se nalazi samo broj, tj 5 ∈ Ω. Dakle, brojevi
nedvosmisleno upuuju na ishode eksperimenta, i obrnuto.
Matematiqki gledano, sledea tri eksperimenta su analogna: ba ae novqia,
parnost dobijenog broja pri ba au ko ki e i boja izvuqene karte iz xpila (52
karte). Neka je u prvom eksperimentu P dogaÆaj "sa gore strane je pismo", a G
je dogaÆaj "sa gore strane je glava". Neka je u drugom eksperimentu P dogaÆaj
"dobijen je paran broj", a N je dogaÆaj "dobijen je neparan broj". Neka je u treem
eksperimentu R dogaÆaj "izvuqena je rvena karta", a B je dogaÆaj "izvuqena je
rna karta". Odgovarajui prostori verovatnoa su
Ω1 = pismo, glava Ω2 = paran, neparan Ω3 = rvena, rnaF1 = Ω1, ∅, P, G F2 = Ω2, ∅, P,N F3 = Ω3, ∅, R, BP (P ) = P (G) = 0.5 P (P ) = P (N) = 0.5 P (R) = P (B) = 0.5
Ako se elementarnim dogaÆajima (u sva tri eksperimenta) pridrue brojevi 1 i
2, onda se ova tri prostora verovatnoe unifi iraju.
Sluqajna promeniva e biti pre izno definisana, kao i oj odgovarajua
raspodela verovatnoe. Razmatrae se razliqiti tipovi sluqajnih promeni-
vih, ihove transforma ije kao i ihove numeriqke karakteristike. Posebno
e biti navedene najznaqajnije sluqajne promenive i dvodimenzionalne sluqajne
promenive.
1.4.1 Sluqajna promeniva, raspodela, funk ija raspo-
dele
Modelovae, odnosno povezivae elementarnih dogaÆaja nekog eksperimenta sa re-
alnim brojevima namee potrebu da se sluqajnim dogaÆajima pridrue podskupovi
realnih brojeva koji takoÆe qine σ-poe, dakle Borelovi skupovi. Odgovarajua
koresponden ija se ostvaruje funk ijom X : Ω → R koja se zove sluqajna pro-
meniva i koja na jedinstven naqin definixe funk iju verovatnoe PX nad
1.4. SLUQAJNE PROMENIVE 25
Borelovim poem. Tako se proizvonom prostoru verovatnoe (Ω,F , P ) pridru-
uje prostor verovatnoe (R,B(R), PX) nad skupom realnih brojeva, slika 1.5.
Ω X
R
0
1
(Ω,F , P ) (R,B(R), PX)
Slika 1.5: Sluqajna promeniva jeste funk ija
Sluqajna promeniva je apstraktan pojam i moe se pridruiti raznim re-
alnim pojavama, xto prikazuju sledei primeri:
1
o
Ba ae ko ki e. Sluqajna promenivaX koja predstava broj taqki a sa
gore strane ko ki e je ve prikazana, (1.2). U okviru istog eksperimenta
se moe posmatrati i sluqajna promeniva Y koja elementarnom dogaÆaju
pridruuje broj - ostatak pri deeu dobijenog broja qetvorkom. U tom
sluqaju je Y (1) = Y (5) = 1, Y (2) = Y (6) = 2, Y (3) = 3 i Y (4) = 4, slika 1.6.
Ω YR
0
1
2
3
ω3
ω2
ω1
ω6
ω5
ω4
Slika 1.6: Primer sluqajne promenive
2
o
Ba ae 3 novqia. U ovom eksperimentu ima 8 elementarnih dogaÆaja,
Ω = PPP,PPG,PGP,GPP,PGG,GPG,GGP,GGG. Broj novqia na kojimaje dobijeno pismo jeste sluqajna promeniva Z koja uzima vrednosti iz skupa
0, 1, 2, 3.
26 POGLAVE 1. VEROVATNOA
3
o
Kuni ubim i. Stanovni i Srbije se klasifikuju u 4 kategorije po
tome da li imaju kunog ubim a: psa, maqku ili nexto tree, ili nemaju.
Za pojedinaqnog ispitanika, upravo ovo su elementarni dogaÆaji. U anketi
koju popuavaju, treba u zavisnosti od toga kojoj kategoriji pripadaju, u
dato poe da upixu neki od brojeva 1,2,3,4. (Na ovaj naqin se obezbeÆuje
bra obrada podataka dobijenih anketiraem.)
4
o
Visina. Sluqajna promeniva H moe da modeluje visinu sluqajno odabra-
nog odraslog muxkar a u Srbiji. Skup vrednosti je sada interval brojeva,
na primer (140, 220) ako se podrazumevaju entimetri kao jedini a mere.
Defini ija 1.4.1 Neka je (Ω,F , P ) prostor verovatnoe. Funk ija X : Ω→ R
se naziva sluqajna promeniva ako za svaki realan broj x ∈ R vai
ω |ω ∈ Ω, X(ω) < x ∈ F . (1.10)
Skup vrednosti sluqajne promenive X je RX = x | x ∈ R, (∃ω ∈ Ω)X(ω) = x.Skup iz uslova (1.10) jeste praslika otvorenog intervala (−∞, x), i moe
se oznaqavati X−1(−∞, x), ali opxte prihvaena oznaka je (X < x). Dakle,
(X < x) = ω |ω ∈ Ω, X(ω) < x i uslov (1.10) se zapisuje
(X < x) ∈ F , ∀x ∈ R.
Ovaj uslov obezbeÆuje da praslika svakog Borelovog skupa S ⊂ R jeste dogaÆaj iz
prostora (Ω,F , P ), pa mu se moe odrediti verovatnoa P (X−1(S)). Taj broj se
uzima i za verovatnou koja se pridruuje skupu S, odnosno verovatnou dogaÆaja
da "sluqajna promeniva X uzme vrednost iz skupa S".
Teorema 1.4.2 Neka je (Ω,F , P ) prostor verovatnoe i X : Ω → R sluqajna
promeniva. Funk ija
PX : B(R)→ [0, 1], PX(S) = P (X ∈ S) = P (ω |X(ω) ∈ S)
jeste verovatnoa i (R,B(R), PX) jeste prostor verovatnoe.
Dokaz se svodi na proveru aksioma verovatnoe.
Defini ija 1.4.3 Funk ija PX definisana u prethodnoj teoremi se naziva
raspodela verovatnoe sluqajne promenive X. Prostor verovatnoe (R,B(R), PX)
se naziva fazni prostor sluqajne promenive X.
1.4. SLUQAJNE PROMENIVE 27
Dakle, sluqajna promeniva X preslikava elementarne dogaÆaje u skup R,
uspostava koresponden iju izmeÆu sluqajnih dogaÆaja i Borelovih skupova, a
time i strukturu prostora verovatnoe (Ω,F , P ) prenosi u poe realnih brojeva,
slika 1.7. Pridruena funk ija verovatnoe PX je definisana na Borelovom
σ-pou xto omoguava primenu mnogih metoda matematiqke analize.
Ω : F [0, 1]P
R
X
: B(R)
X−1
PX
Slika 1.7: Koresponden ija prostora verovatnoe i egovog faznog prostora
Za jox neke od Borelovih skupova se uvode posebne oznake:
(X = x) := ω |ω ∈ Ω, X(ω) = x, (a ≤ X < b) := ω |ω ∈ Ω, X(ω) ∈ (a, b).
Primer. Ve pomenute sluqajne promenive imaju sledee raspodele verovatnoa:
1
o
Za X je raspodela data ranije (1.2). Za Y se raqunaju verovatnoe, vero-
vatnoa da sluqajna promeniva Y uzme vrednost 2 je P (Y = 2) = P (2, 6) =26, pa je raspodela
Y :
(
0 1 2 316
26
26
16
)
.
2
o
Raspodela sluqajne promenive Z se naziva Binomna raspodela sa parametrima
3 i 12, i ona e biti objaxena u nastavku.
3
o
Raspodela sluqajne promenive V mora biti odreÆena na osnovu podataka,
po sprovedenoj anketi. Na primer,
V :
(
1 2 3 4
0.45 0.25 0.1 0.2
)
.
4
o
Indikator dogaÆaja A. To je sluqajna promeniva koja se definixe na
sledei naqin
IA(ω) =
1, ω ∈ A
0, ω /∈ A,IA : Ω→ 0, 1 ⊂ R,
gde je A dogaÆaj iz prostora (Ω,F , P ) qija je verovatnoa p = P (A). Raspo-
dela indikatora dogaÆaja A je
IA :
(
0 1
q p
)
, q = 1− p.
28 POGLAVE 1. VEROVATNOA
Verovatnoa P (X < x) zavisi samo od realnog broja x. Zato se definixe
odgovarajua funk ija jedne realne promenive, raspodela verovatnoe skupova
oblika (−∞, x), x ∈ R,
FX : R→ [0, 1], FX(x) = P (X < x). (1.11)
Defini ija 1.4.4 Neka je (Ω,F , P ) prostor verovatnoe i X : Ω → R slu-
qajna promeniva. Funk ija FX definisana u (1.11) se naziva funk ija raspo-
dele sluqajne promenive X.
Svaka sluqajna promeniva odreÆuje jednu funk iju raspodele, ali obrnuto
nije taqno. Mogue je da razliqite sluqajne promenive imaju istu funk iju
raspodele. Ako je jasno o kojoj sluqajnoj promenivoj se radi, umesto oznake
FX(x) koristi se samo F (x).
Primer. Za sluqajnu promenivu Y (iz primera ba ae ko ki e) funk ija
raspodele je razgranata funk ija i ima stepenast grafik, slika 1.8.
x
FY (x)
0 1 2 3 4
16
36
56
1
FY (x) =
0, x ≤ 0,16, 0 < x ≤ 1,
36, 1 < x ≤ 2,
56, 2 < x ≤ 3,
1, 3 < x.
Slika 1.8: Primer funk ije raspodele i odgovarajueg grafika
Teorema 1.4.5 Neka je F (x) funk ija raspodele sluqajne promenive X. Onda
funk ija F ima sledee osobine:
1. F (−∞) := limx→−∞
F (x) = 0
2. F (∞) := limx→∞
F (x) = 1
3. P (a ≤ X < b) = F (b)− F (a), za a, b ∈ R, a < b
4. Funk ija raspodele je monotono neopadajua funk ija,
x1 < x2 ⇒ F (x1) ≤ F (x2), za x1, x2 ∈ R
1.4. SLUQAJNE PROMENIVE 29
5. Funk ija raspodele je neprekidna sa leve strane,
limx→a−
F (x) = F (a), za a ∈ R.
Dokaz
1
. Dokaz je zasnovan na osobinama verovatnoe kao funk ije, naroqito
enih svojstava neprekidnosti.
1. F (−∞) = limn→∞
F (−n) = limn→∞
P (X < −n) = P
( ∞⋂
n=1
(−∞,−n))
= P (∅) = 0.
2. F (∞) = limn→∞
F (n) = limn→∞
P (X < n) = P
( ∞⋃
n=1
(−∞, n)
)
= P (X <∞) = 1.
3. Zbog rela ije meÆu Borelovim skupovima (X < b) = (X < a) + (a ≤ X < b),
vai P (X < b) = P (X < a) + P (a ≤ X < b), odakle je
P (a ≤ X < b) = P (X < b)− P (X < a) = F (b)− F (a).
4. Monotonost funk ije raspodele je posledi a monotonosti verovatnoe i
odnosa inkluzije meÆu Borelovim skupovima,
x1 < x2 ⇒ (−∞, x1) ⊂ (−∞, x2).
5. limx→a−
F (x) = limn→∞
F
(
a− 1
n
)
= limn→∞
P
(
X < a− 1
n
)
= P
( ∞⋃
n=1
(
−∞, a− 1
n
)
)
= P (−∞, a) = F (a).
Teorema 1.4.6 Funk ija F : R→ R jeste funk ija raspodele neke sluqajne pro-
menive ako i samo ako je neopadajua, neprekidna s leva i vai F (−∞) = 0 i
F (∞) = 1.
Sluqajne promenive prenose sve prostore verovatnoe na odgovarajue fazne
prostore, koji su meÆusobno uporedivi, i ihova analiza se svodi na analizu
funk ije raspodele.
1.4.2 Razliqiti tipovi sluqajnih promenivih
Prema broju elemenata u skupu vrednosti RX , sluqajne promenive se dele u dve
grupe:
• RX je konaqan ili prebrojiv skup - onda je X diskretna sluqajna promen-
iva;
• RX je neprebrojiv.
Raspodela diskretne sluqajne promenive X je odreÆena zakonom raspodele
koji svakom realnom broju iz skupa vrednosti xi ∈ RX dodeuje verovatnou
1
Zapis dokaza nije matematiqki pre izan, izostaveni su neki pojmovi iz oblasti topologije
30 POGLAVE 1. VEROVATNOA
pi = P (X = xi). Prikazuje se xematski,
X :
(
x1 x2 . . . xi . . .
p1 p2 . . . pi . . .
)
, (1.12)
a kako je Ω =⋃
i∈N(X = xi) pri qemu su skupovi (X = xi), i ∈ N disjunktni, vai
∑
i∈Npi = 1. (1.13)
Za proizvoan Borelov skup S, verovatnoa P (X ∈ S) se dobija kao suma vero-
vatnoa vrednosti koje se nalaze u skupu S,
P (X ∈ S) =∑
xi∈Sp(xi).
Funk ija raspodele je odreÆena sumama,
F (x) =∑
xi<x
pi,
i en grafik je stepenasta funk ija, sa prekidima, a prekida ima najvixe pre-
brojivo mnogo.
Primer diskretne sluqajne promenive je Y , ostatak pri deeu sa 4 dobi-
jenog broja prilikom ba aa ko ki e.
U okviru druge grupe su posebno znaqajne sluqajne promenive qiji skup vred-
nosti jeste neprebrojiv Borelov skup, najqexe interval brojeva. Za raspodelu
ovakve sluqajne promenive opet mora da vai P (X ∈ RX) = 1, a kako elemen-
tarnih dogaÆaja ima beskonaqno mnogo, jasno je da je za pojedinaqan broj a ∈ RX
dogaÆaj X = a skoro nemogu, odnosno vai P (X = a) = 0.
Defini ija 1.4.7 Suqajna promeniva X je apsolutno neprekidnog tipa ako
postoji funk ija ϕ : R→ R+takva da je
F (x) =
∫ x
−∞ϕ(t) dt, (1.14)
gde je F (x) funk ija raspodele sluqajne promenive X. Funk ija ϕ se zove gustina
raspodele verovatnoe (krae gustina) sluqajne promenive X.
Analogno sa (1.13), maksimalna vrednost integrala gustine sluqajne promenive
mora biti jednaka 1, odnosno∫ ∞
−∞ϕ(t) dt =
∫
RX
ϕ(t) dt = 1.
1.4. SLUQAJNE PROMENIVE 31
Osobine i ponaxae apsolutno neprekidne sluqajne promenive u potpunosti
opisuje ena gustina raspodele, odnosno funk ija raspodele qije osobine su date
u sledeoj teoremi.
Teorema 1.4.8 Neka je X apsolutno neprekidna sluqajna promeniva, F (x) ena
funk ija raspodele i ϕ(x) ena gustina raspodele. Tada vai:
1. F (x) =
∫ x
−∞ϕ(t) dt,
2. ϕ(x) = F ′(x), u taqkama gde je ϕ neprekidna,
3. Za svaka dva realna broja a, b ∈ R vai
P (a < X < b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a ≤ X ≤ b) =
b∫
a
ϕ(t)dt.
Primer apsolutno neprekidne sluqajne promenive je visina sluqajno odabra-
nog muxkar a. Jox jedan primer je sluqajna promeniva koja predstava vek
trajaa baterije mobilnog telefona T . Ova sluqajna promeniva moe da uzme
vrednosti od 0 do 100000 sati, i baterija moe prestati sa radom u bilo kom
trenutku iz intervala RT = [0, 100000].
Napomena. U daem tekstu e "neprekidne sluqajne promenive" podrazume-
vati da su one apsolutno neprekidne.
1.4.3 Transforma ije sluqajnih promenivih
Sluqajne promenive se transformixu po prin ipu kompozi ije (slagaa) funk-
ija. Neka jeX sluqajna promeniva koja preslikava prostor verovatnoe (Ω,F , p)u R i neka je g : R → R neprekidna funk ija
2
. Onda kompozi ija preslikavaa
g X : Ω→ R takoÆe jeste sluqajna promeniva (slika 1.9) i obeleava se
Y = g(X) = g X, Y (ω) = g(X(ω)), ω ∈ Ω.
Ako je poznata raspodela sluqajne promenive X onda se na osnovu funk ije g
i enih karakteristika moe odrediti raspodela verovatnoa sluqajne promen-
ive Y .
2
Razmatrae vai za xiru klasu funk ija, ali ovde je fokus na neprekidnim transforma-
ijama.
32 POGLAVE 1. VEROVATNOA
g(x)
0
x
Ω
ωω
X(ω)
Y (ω)
Y = g(X)
g(x)
Slika 1.9: Kompozi ija funk ije i sluqajne promenive
Ako je X diskretna sluqajna promeniva sa skupom vrednosti RX i zakonom
raspodele (1.12), onda je i Y diskretna sluqajna promeniva, sa skupom vrednosti
RY = y1, y2, . . . , yi, . . . i zakonom raspodele
Y :
(
y1 y2 . . . yi . . .
P (y1) P (y2) . . . P (yi) . . .
)
, P (yi) =∑
g(xk)=yi
pk.
Broj elemenata u skupu RY je mai ili jednak sa brojem elemenata u RX .
Primer. Neka je g(x) = x2funk ija koja transformixe sluqajnu promenivu X
u Y = g(X) = X2. Na osnovu zakona raspodele sluqajne promenive X dobija se
zakon raspodele za Y ,
X :
(
−2 −1 0 1 2 3
0.1 0.2 0.1 0.1 0.3 0.2
)
g−→ Y :
(
0 1 4 9
0.1 0.3 0.4 0.2
)
.
Skup vrednosti RY ima mae elemenata zbog g(−2) = g(2) i g(−1) = g(1), a
verovatnoe u raspodeli za Y su
P (Y = 0) = P (X = 0) = 0.1, P (Y = 1) = P (X = −1) + P (X = 1) = 0.2 + 0.1
P (Y = 4) = P (X = −2) + P (X = 2) = 0.1 + 0.3, P (Y = 9) = P (X = 3) = 0.2.
Kada je X neprekidna sluqajna promeniva, tip transformisane sluqajne
promenive Y = g(X) zavisi od karakteristika funk ije g (moe biti takoÆe
neprekidna, diskretna ali i mexovitog tipa). Problem je znaqajno sloeniji
nego u diskretnom sluqaju i bie razmatran samo poseban sluqaj kada je funk ija
g monotona.
Neka je g monotono rastua neprekidna funk ija. Onda funk ija raspodele
1.4. SLUQAJNE PROMENIVE 33
FY zavisi od FX na sledei naqin:
FY (y) = P (Y < y) = P (g(X) < y) = P (g−1(g(X)) < g−1(y)) = P (X < g−1(y))
= FX(g−1(y)).
Na osnovu teoreme 1.4.8 i izvoda sloene funk ije, gustine raspodela ove dve
sluqajne promenive su povezane rela ijom
ϕY (y) = F ′Y (y) = (FX(g
−1(y))′= F ′
X(g−1(y)) · (g−1(y))
′
= ϕX(g−1(y)) · (g−1(y))
′.
Ako je g monotono opadajua funk ija, odgovarajue rela ije se dobijaju na
sliqan naqin,
FY (y) = P (Y < y) = P (g(X) < y) = P (g−1(g(X)) > g−1(y)) = P (X > g−1(y))
= 1− P (X ≤ g−1(y)) = 1− P (X = g−1(y))− P (X < g−1(y))
= 1− 0− P (X < g−1(y)) = 1− FX(g−1(y)),
ϕY (y) = F ′Y (y) = − (FX(g
−1(y))′= −F ′
X(g−1(y)) · (g−1(y))
′
= −ϕX(g−1(y)) · (g−1(y))
′.
Kako je za monotono opadajuu funk iju prvi izvod negativan (g−1(y))′< 0, to je
i u ovom sluqaju gustina raspodele ϕY nenegativna.
Transforma ije se nekad sprovode i sa iem objediavaa vixe sluqajnih
promenivih u jednu. Ovakve transforma ije imaju naroqiti znaqaj u statis-
ti i. Primer e biti prikazan nakon uvoÆea dvodimenzionalnih sluqajnih
promenivih.
1.4.4 Dvodimenzionalne sluqajne promenive
Dvodimenzionalne sluqajne promenive su uopxtee pojma jednodimenzionalne
sluqajne promenive, a spe ijalan sluqaj pojma vixedimenzionalne sluqajne pro-
menive, odnosno sluqajnog vektora. Pre izna defini ija obuhvata Borelovo
σ-poe u n-dimenzionalnom prostoru Rna ovde e u defini iji biti iskorix-
en potreban i dovoan uslov da je svaka komponenta sluqajnog vektora (jednodi-
menzionalna) sluqajna promeniva. U nastavku e na intuitivnom nivou biti
definisane dvodimenzionalne sluqajne promenive, ihove raspodele i funk ije
raspodele, kao i osobine i numeriqke karakteristike dvodimenzionalne sluqajne
promenive diskretnog tipa.
Za proizvoan prostor verovatnoe sluqajna promeniva svakom elementarnom
dogaÆaju pridruuje realan broj koji opisuje jednu egovu osobinu (visinu, teinu,
34 POGLAVE 1. VEROVATNOA
starost,...). Nekad je od interesa posmatrati istovremeno dve sluqajne promen-
ive (ili vixe ih) nad istim prostorom verovatnoe, odnosno, istovremeno
pratiti dve osobine elementarnih dogaÆaja.
Defini ija 1.4.9 Neka je (Ω,F , P ) prostor verovatnoe i neka su X : Ω → R
i Y : Ω→ R dve sluqajne promenive. Onda je
(X, Y ) : Ω→ R2, (X, Y )(ω) = (X(ω), Y (ω)) = (x, y)
dvodimenzionalna sluqajna promeniva.
Svakom elementarnom dogaÆaju se pridruuje ureÆeni par brojeva, a time i
taqka u ravni R2, kao na sli i 1.10. Analogno, n-dimenzionalna sluqajna pro-
meniva elementarnom dogaÆaju pridruuje ureÆenu n-torku brojeva.
Defini ija 1.4.10 Neka su X1, X2, . . . , Xn sluqajne promenive na istom pros-
toru verovatnoe (Ω,F , P ). UreÆena n-torka (X1, X2, . . . , Xn) se naziva n-dimenzionalna
sluqajna promeniva i vai
(X1, X2, . . . , Xn) : Ω→ Rn, (X1, . . . , Xn)(ω) = (X1(ω), . . . , Xn(ω)) = (x1, . . . , xn).
Funk ija raspodele dvodimenzionalne sluqajne promenive (X, Y ) ima dva
argumenta, FXY : R2 → [0, 1] i odreÆena je verovatnoom dogaÆaja
FXY (x, y) = P (X < x, Y < y) = P (ω ∈ Ω |X(ω) < x ∧ Y (ω) < y).
ene osobine su analogne osobinama obiqne funk ije raspodele koje su date u
Teoremi 1.4.5:
1. FXY (−∞, y) = FXY (x,−∞) = 0
2. FXY (∞,∞) = 1
3. P (x1 ≤X< x2, y1 ≤Y < y2) = FXY (x2, y2)+FXY (x1, y1)−FXY (x1, y2)−FXY (x2, y1)
4. FXY (x, y) je monotono neopadajua funk ija po obe promenive
5. FXY (x, y) je neprekidna s leva po obe promenive.
Na osnovu funk ije raspodele dvodimenzionalne sluqajne promenive FXY (x, y)
mogu se odrediti funk ije raspodela enih komponenata, FX(x) i FY (y), koje se
nazivaju marginalne funk ije raspodele
FX(x) = FXY (x,∞), FY (y) = FXY (∞, y).
1.4. SLUQAJNE PROMENIVE 35
R
0 R
Ω
(x, y)
ω
X(ω)
Y (ω)
(X, Y )
Slika 1.10: Dvodimenzionalna sluqajna promeniva
Ako su X i Y diskretnog tipa sa skupovima vrednosti
3 RX = x1, x2, . . . , xni RY = y1, y2, . . . , yk, onda je i (X, Y ) diskretna dvodimenzionalna sluqajna
promeniva sa skupom vrednosti RXY ⊂ R2,
RXY = RX ×RY = (xi, yj) | i = 1, . . . , n ∧ j = 1, . . . , k.
U nastavku se razmatraju samo ovakve diskretne dvodimenzionalne sluqajne pro-
menive.
Raspodela verovatnoa diskretne dvodimenzionalne sluqajne promenive (X, Y )
sadri informa ije o pojedinaqnim verovatnoama
pij := P (X = xi, Y = yj), i = 1, . . . , n, j = 1, . . . , k,
a odgovarajua funk ija raspodele zavisi od pojedinaqnih verovatnoa na sledei
naqin
FXY (x, y) =∑
i:xi<x
∑
j:yj<y
pij . (1.15)
Marginalne verovatnoe u diskretnom sluqaju su:
pi = p(xi) = P (X = xi, Y ∈ RY ) =k∑
j=1
pij , i = 1, . . . , n,
qj = p(yj) = P (X ∈ RX , Y = yj) =
n∑
i=1
pij , j = 1, . . . , k.
3
Bez smaea opxtosti se moe razmatrati sluqaj kada su ovi skupovi konaqni. U sluqaju
prebrojivih skupova, svi pojmovi su analogno definisani, umesto konaqnih suma pojavuju se
redovi.
36 POGLAVE 1. VEROVATNOA
Zakon raspodele diskretne dvodimenzionalne sluqajne promenive (X, Y ), kao i
odgovarajue marginalne verovatnoe, obiqno se prikazuju u vidu tabele
X\Y y1 y2 . . . yk
x1 p11 p12 . . . p1k p1
x2 p21 p22 . . . p2k p2.
.
.
.
.
.
.
.
. . . ..
.
.
.
.
.
xn pn1 pn2 . . . pnk pn
q1 q2 . . . qk 1
Kod dvodimenzionalnih sluqajnih promenivih je od znaqaja i razmatrae us-
lovnih verovatnoa i uslovnih raspodela,
X|Y =yj :
(
x1 x2 . . . xn
P (x1|yj) P (x2|yj) . . . P (xn|yj)
)
,
pri qemu su uslovne verovatnoe
P (xi|yj) =P (X = xi, Y = yj)
P (Y = yj)=
pijqj
.
Analogno su odreÆene i uslovne raspodele Y |X = xi.
Nezavisnost sluqajnih promenivih je uopxtee pojma nezavisnosti doga-
Æaja. Sluqajne promenive su nezavisne ako su nezavisni dogaÆaji kojima su one
pridruene
4
.
Defini ija 1.4.11 Sluqajne promenive X i Y su nezavisne ako za ihove
funk ije raspodele FX i FY , i zajedniqku funk iju raspodele FXY vai
FXY (x, y) = FX(x) · FY (y), x, y ∈ R. (1.16)
U diskretnom sluqaju ovaj uslov se lako proverava, primenom sledee teoreme.
Teorema 1.4.12 Diskretne sluqajne promenive X i Y su nezavisne ako i samo
ako
p(xi, yj) = p(xi) · p(yj), i = 1, . . . , n, j = 1, . . . , k. (1.17)
4
Pre izna defini ija je izostavena, a dat je potreban i dovoan uslov koji se odnosi na
dvodimenzionalne sluqajne promenive.
1.4. SLUQAJNE PROMENIVE 37
Dokaz. Ako su sve jednakosti u (1.17) taqne, onda nezavisnost sluqajnih promen-
ivih X i Y sledi na osnovu
FXY (x, y) =∑
i:xi<x
∑
j:yj<y
p(xi, yj) =∑
i:xi<x
∑
j:yj<y
p(xi) · p(yj)
=∑
i:xi<x
p(xi) ·∑
j:yj<y
p(yj) = FX(x) · FY (y)
Obrnuto. Za svako (xi, yj) ∈ RXY postoje pozitivni realni brojevi ε, η ∈ R takvi
da je [xi − ε, xi + ε)∩RX = xi i [yj − η, yj + η)∩RY = yj. Kako su X i Y neza-
visne sluqajne promenive, onda vai (1.16), pa se na osnovu osobina funk ije
FXY dobija
p(xi, yj) = P (X = xi, Y = yj) = P (xi − ε ≤ X < xi + ε, yj − η ≤ Y < yj + η)
= FXY (xi + ε, yj + η)) + FXY (xi − ε, yj − η))
−FXY (xi + ε, yj − η))− FXY (xi − ε, yj + η))
= FX(xi + ε)FY (yj + η)) + FX(xi − ε)FY (yj − η))
−FX(xi + ε)FY (yj − η))− FX(xi − ε)FY (yj + η))
= (FX(xi + ε)− FX(xi − ε)) (FY (yj + η)− FY (yj − η))
= P (xi − ε ≤ X < xi + ε) · P (yj − η ≤ Y < yj + η)
= P (X = xi) · P (Y = yj) = p(xi) · p(yj),xto je i trebalo dokazati.
Primer. W = U + X . Neka sluqajna promeniva U predstava izvuqeni broj
iz kutije sa kugli ama, u kojoj se nalazi 6 kugli a sa napisanim brojem 1 i 3
kugli e sa napisanim brojem 2, i neka je X sluqajna promeniva koja predstava
dobijeni broj pri ba au ko ki e (1.2). Treba odrediti sluqajnu promenivu W
koja prikazuje zbir broja na izvuqenoj kugli i i broja dobijenog na ko ki i.
Prvo se formira dvodimenzionalna sluqajna promeniva (U,X), a zatim seW do-
bija kao transforma ija dvodimenzionalne sluqajne promenive, W = g(U,X) =
U +X . Jasno je kakav zakon raspodele ima U i koji je skup vrednosti za W ,
U :
(
1 223
13
)
, RW = 2, 3, 4, 5, 6, 7, 8.
Eksperimenti ba aa ko ki e i izvlaqea kugli e su meÆusobno nezavisni xto
olakxava izraqunavaa raspodele verovatnoa za (U,X):
U\X 1 2 3 4 5 6
1
218
218
218
218
218
218
23
2
118
118
118
118
118
118
13
16
16
16
16
16
16
38 POGLAVE 1. VEROVATNOA
Sluqajna promeniva W ima vrednost 2 samo ako je izvuqeno 1 i dobijeno 1,
P (W = 2) = P (U = 1, X = 1). Zbir je W = 3 ako je izvuqeno 1 i dobijeno 2, ili
izvuqeno 2 i dobijeno 1,
P (W = 3) = P (U = 1, X = 2) + P (U = 2, X = 1) = 218
+ 118
= 16.
Dae je
P (W = 4) = P (U = 1, X = 3) + P (U = 2, X = 2),
P (W = 5) = P (U = 1, X = 4) + P (U = 2, X = 3),
P (W = 6) = P (U = 1, X = 5) + P (U = 2, X = 4),
P (W = 7) = P (U = 1, X = 6) + P (U = 2, X = 5),
P (W = 8) = P (U = 2, X = 6),
odakle se dobija raspodela zbira sluqajnih promenivih U i X :
W :
(
2 3 4 5 6 7 819
16
16
16
16
16
118
)
.
Primer. Dvodimenzionalna sluqajna promeniva (X, Y ) je data zakonom
raspodele,
X\Y 2 5 8 9
0 220
320
120
0
1 0 520
220
120
2 0 220
220
220
(a) Odrediti marginalne raspodele za X i Y .
(b) Odrediti verovatnoe: P (Y > 5), P (Y < 5),
P (X = 1|Y = 9), P (Y <8|X = 0), P (Y <8|X>0)
( ) Odrediti sledee vrednosti funk ije raspodele:
FXY (0, 0), FXY (0, 5), FXY (2, 2), FXY (0.5, 6),
FXY (2, 9), FXY (2.7, 9.01)
(d) Proveriti nezavisnost sluqajnih promenivih
X i Y .
(a) Na osnovu zakona raspodele za (X, Y ), jasno je da su skupovi vrednosti RX =
0, 1, 2 i RY = 2, 5, 8, 9. VerovatnoeP (X = 0) = P (X = 0, Y = 2) + P (X = 0, Y = 5)
+P (X = 0, Y = 8) + P (X = 0, Y = 9)
= 220
+ 320
+ 120
+ 0 = 620
P (X = 1) = P (X = 1, Y = 2) + P (X = 1, Y = 5)
+P (X = 1, Y = 8) + P (X = 1, Y = 9)
= 0 + 520
+ 220
+ 120
= 820
1.4. SLUQAJNE PROMENIVE 39
P (X = 2) = P (X = 2, Y = 2) + P (X = 2, Y = 5)
+P (X = 2, Y = 8) + P (X = 2, Y = 9)
= 0 + 220
+ 220
+ 220
= 620
se mogu dobiti i jednostavnim sabiraem vrednosti iz zakona raspodele, po vrstama.
Analogno, sabiraem vrednosti po kolonama, dobijaju se verovatnoe marginalne
raspodele za Y , na primer,
P (Y = 5) = P (X ∈ RX , Y = 5)
= P (X = 0, Y = 5) + P (X = 1, Y = 5) + P (X = 2, Y = 5)
= 320
+ 520
+ 220
= 1020.
Marginalne raspodele su
X :
(
0 1 2620
820
620
)
, Y :
(
2 5 8 9220
1020
520
320
)
, (1.18)
odnosno
X\Y 2 5 8 9
0 220
320
120
0 620
1 0 520
220
120
820
2 0 220
220
220
620
220
1020
520
320
1
(b) DogaÆaj Y < 5 se realizuje ako dvodimenzionalna sluqajna promeniva uzme
neku od vrednosti (X, Y ) ∈ (0, 2), (1, 2), (2, 2), pa jeP (Y < 5) =
2
20+ 0 + 0 =
2
20,
xto se moe zakuqiti i na osnovu marginalne raspodele. Sliqnim razmatraem
se odreÆuju i ostale verovatnoe,
P (Y > 5) = P ((X, Y ) ∈ (0, 8), (1, 8), (2, 8), (0, 9), (1, 9), (2, 9))
=1
20+
2
20+
2
20+ 0 +
1
20+
2
20=
8
20
P (X = 1|Y = 9) =P (X = 1, Y = 9)
P (Y = 9)=
120320
=1
3
P (Y < 8|X = 0) =P (X = 0, Y ∈ 2, 5)
P (X = 0)=
220
+ 320
620
=5
6
P (Y < 8|X > 0) =P (X ∈ 1, 2, Y ∈ 2, 5)
P (X ∈ 1, 2) =0 + 5
20+ 0 + 2
20820
+ 620
=7
14.
(c) Traene vrednosti se dobijaju primenom (1.15),
FXY (0, 0) = P (X < 0, Y < 0) = 0,
40 POGLAVE 1. VEROVATNOA
FXY (0, 5) = P (X < 0, Y < 5) = 0,
FXY (2, 2) = P (X < 2, Y < 2) = 0,
FXY (0.5, 6) = P (X = 0, Y ∈ 2, 5) = 2
20+
3
20=
5
20,
FXY (2, 9) = P (X < 2, Y < 9) = P (X ∈ 0, 1, Y ∈ 2, 5, 8)
=2
20+
3
20+
1
20+ 0 +
5
20+
2
20=
13
20
FXY (2.7, 9.01) = P (X < 2.7, Y < 9.01) = 1.
(d) Nezavisnost se proverava na osnovu uslova (1.16). UtvrÆuje se, na primer
P ((X = 2, Y = 2) = 0 6= 6
20· 220
= P (X = 2) · P (Y = 2)
tako da X i Y nisu meÆusobno nezavisne sluqajne promenive.
1.4.5 Numeriqke karakteristike sluqajnih promenivih
Sve informa ije o sluqajnoj promenivoj i enoj raspodeli verovatnoa sadri
funk ija raspodele, odnosno zakon raspodele u diskretnom sluqaju, i gustina
raspodele u neprekidnom sluqaju. Qesto je za raspodelu dovono znati samo ene
karakteristiqne vrednosti, brojeve koji oslikavaju glavne karakteristike raspo-
dele. To su entralna vrednost skupa vrednosti sluqajne promenive i veliqina
koja e opisati kako su ostale vrednosti rasporeÆene oko entralne i koliko su
od e udaene.
Numeriqke karakteristike su brojevi koji reprezentuju osobine sluqajne pro-
menive i najqexe korixene spadaju u jednu od dve grupe:
⋄ mere entralne tenden ije - ove numeriqke karakteristike su vrednostikoje samostalno reprezentuju sluqajnu promenivu, tu spadaju: matematiqko
oqekivae, medijana, modus, momenti reda k;
⋄ mere disperzije/odstupaa - opisuju rasturae sluqajne promennive
oko entralne vrednosti, tu spadaju: disperzija (varijansa), standardna de-
vija ija, entralni momenti reda k.
Za numeriqke karakteristike se jox kae da su parametri sluqajne promenive.
U nastavku e pomenuti parametri biti definisani za oba tipa sluqajnih pro-
menivih. Podrazumeva se da diskretna sluqajna promeniva ima zakon raspo-
dele (1.12), i da je neprekidna sluqajna promeniva odreÆena svojom gustinom
raspodele ϕ (1.14) i odgovarajuom funk ijom raspodele F .
1.4. SLUQAJNE PROMENIVE 41
Matematiqko oqekivae je najqexe korixena numeriqka karakteris-
tika koja reprezentuje entar raspodele i odgovara intuitivnom pojmu "proseqne
vrednosti".
Defini ija 1.4.13 Matematiqko oqekivae sluqajne promenive X je defin-
isano izrazom
E(X) =
∑
i
xi · pi, X − diskretna
∫ ∞
−∞x · ϕ(x) dx, X − neprekidna
(1.19)
uz uslov da red (u diskretnom sluqaju), odnosno nesvojstveni integral apsolutno
konvergira
5
.
Ako red, odnosno integral ne konvergiraju, matematiqko oqekivae ne postoji.
Dae se primeuje da broj E(X) ne mora pripadati skupu vrednosti sluqajne
promenive RX .
Osobine matematiqkog oqekivaa se navode u vidu tvrÆea koja se mogu dokazati,
a dokazi su trivijalni ili podrazumevaju pojmove iz domena Analize, pa su
izostaveni.
Teorema 1.4.14 Neka su X i Y sluqajne promenive i a i b konstante. Onda
vai:
1
o E(a) = a
2
o a ≤ X ≤ b → a ≤ E(X) ≤ b
3
o E(X + Y ) = E(X) + E(Y )
4
o E (X − E(X)) = 0, oqekivae " entrirane" sluqajne promenive je 0
5
o E(aX + b) = aE(X) + b
6
o
ako su X i Y nezavisne, onda je E(X · Y ) = E(X) · E(Y )
Medijana je broj me za koji je taqno
P (X < me) = P (X > me).
Medijana uvek postoji, jedinstvena je i ne mora biti u skupu vrednosti sluqajne
promenive.
5
Apsolutna konvergen ija je pojam iz oblasti analize funk ija realne promenive i nije
kru ijalan za razumevae sadraja. ObezbeÆuje izraqunivost pomenute sume, odnosno inte-
grala.
42 POGLAVE 1. VEROVATNOA
Modus je vrednost sluqajne promenive sa najveom verovatnoom.
Ako je X diskretnog tipe, modus je mo ∈ RX za koji vai
p(mo) ≥ p(xi), xi ∈ RX .
Ako jeX neprekidna, onda u taqkama modusa gustina raspodele dostie maksimum,
ϕ(mo) ≥ ϕ(x), x ∈ R.
Sluqajna promeniva moe imati vixe modusa. Sluqajna promeniva je uni-
modalna ako ima jedan modus.
Momenti reda k su uopxtea matematiqkog oqekivaa. Taqnije, moment
prvog reda je bax E(X), a ostali momenti sluqajne promenive X su
mk(X) =
∑
i
xki · pi, X − diskretna
∫ ∞
−∞xk · ϕ(x) dx, X − neprekidna
i postoje ukoliko red odnosno integral apsolutno konvergiraju.
Disperzija ili varijansa je numeriqka karakteristika koja opisuje odstu-
pae od entra raspodele, odnosno opisuje rasturae vrednosti sluqajne promen-
ive X oko matematiqkog oqekivaa E(X).
Defini ija 1.4.15 Disperzija sluqajne promenive X je
D(X) = σ2(X) = E(
(X − E(X))2)
.
Disperzija se obiqno ne raquna po defini iji, nego primenom sledeeg tvrÆea.
Teorema 1.4.16 D(X) = E(X2)− E2(X)
Dokaz. Ovo je posledi a osobina matematiqkog oqekivaa i qieni e da je E(X)
konstanta,
D(X) = E ((X − E(X))2) = E(X2 − 2X · E(X) + E2(X))
= E(X2)− 2E(X · E(X)) + E2(X) = E(X2)− 2E(X) ·E(X) + E2(X)
= E(X2)−E2(X).
Osobine disperzije su navedene u sledeoj teoremi.
Teorema 1.4.17 Neka su X i Y sluqajne promenive i a konstanta. Onda vai:
1.4. SLUQAJNE PROMENIVE 43
1
o D(a) = 0
2
o D(X) ≥ 0
3
o D(aX) = a2D(X)
4
o D(X + a) = D(X)
5
o
ako su X i Y nezavisne onda D(X + Y ) = D(X) +D(Y )
Dokaz. Osobine matematiqkog oqekivaa omoguavaju direktnu proveru svih
tvrÆea.
1. D(a) = E((a−E(a))2) = E(0) = 0
2. (X−E(X))2 ≥ 0, a matematiqko oqekivae nenegativne sluqajne promenive
je nenegativno, D(X) ≥ 0.
3. D(aX) = E ((aX −E(aX))2) = E ((aX − aE(X))2) = E ([a(X − E(X))]2)
= a2E ((X − E(X))2) = a2D(X)
4. D(X + a) = E ([X + a− E(X + a)]2) = E ([X +a− (E(X) +a)]2) = D(X)
5. Za nezavisne sluqajne promeniveX i Y se iskazuju matematiqka oqekivaa
ihovog zbira i proizvoda E(X+Y ) = E(X)+E(Y ) i E(XY ) = E(X)E(Y ),
odakle sledi
D(X + Y ) = E ([X + Y − E(X + Y )]2) = E ([X − E(X) + Y − E(Y )]2)
= E ([X −E(X)]2) + 2E ((X − E(X))(Y −E(Y ))) + E ([Y −E(Y )]2)
= D(X) + 2E (XY − E(X)Y −XE(Y ) + E(X)E(Y )) +D(Y )
= D(X) +D(Y ) + 2(
E(XY )−E(X)E(Y )−❳❳❳❳❳❳
E(X)E(Y ) +❳❳❳❳❳❳E(X)E(Y )
)
.
Standardno odstupae odnosno standardna devija ija se raquna na os-
novu disperzije, i sve egove osobine proizilaze iz osobina disperzije.
Defini ija 1.4.18 Standardno odstupae ili standardna devija ija je kvadratni
koren disperzije, σ(X) =√
D(X).
Standardno odstupae ima istu jedini u mere kao i sluqajna promeniva, pa je
zato praktiqnije i qexe u upotrebi od disperzije.
44 POGLAVE 1. VEROVATNOA
Centralni momenti reda k su uopxtea pojma disperzije i definisani
su kao matematiqko oqekivae k-tog stepena entrirane sluqajne promenive,
sk = E(
(X − E(X))k)
.
Disperzija je oqigledno entralni moment drugog reda. Centralni momenti
treeg i qetvrtog reda ukazuju na oblik raspodele verovatnoa, na enu asimet-
riqnost i spoxtenost.
Vana transforma ija sluqajne promenive X je standardiza ija,
X∗ =X − E(X)
σ(X), (1.20)
jer se dobija entrirana sluqajna promeniva sa jediniqnom disperzijom xto
potvrÆuje sledea teorema.
Teorema 1.4.19 Za proizvonu sluqajnu promenivu X, parametri standardi-
zovane sluqajne promenive X∗su
E(X∗) = 0, D(X∗) = 1.
Dokaz.
E (X∗) = E
(
X − E(X)
σ(X)
)
=1
σ(X)· E (X − E(X)) =
1
σ(X)· 0 = 0
D (X∗) = D
(
X −E(X)
σ(X)
)
=1
σ2(X)·D (X −E(X)) =
1
σ2(X)·D (X) = 1.
Korixene su osobine matematiqkog oqekivaa i disperzije.
Numeriqke karakteristike dvodimenzionalne sluqajne promenive
Matematiqko oqekivae i disperzija dvodimenzionalne proizvone sluqajne pro-
menive (X, Y ) se definixu na osnovu odgovarajuih numeriqkih karakteristika
komponenata X i Y ,
E(X, Y ) = (E(X), E(Y )) , D(X, Y ) = (D(X), D(Y )) .
Neke numeriqke karakteristike dvodimenzionalne sluqajne promenive ukazuju
na meÆusobnu zavisnost komponenata, i zato su od posebnog znaqaja mexoviti mo-
menti, kovarijansa i koefi ijent korela ije.
Mexoviti moment reda a + b dvodimenzionalne diskretne sluqajne pro-
menive je
mab = E(XaY b) =∑
i
∑
j
xai y
bjpij.
1.4. SLUQAJNE PROMENIVE 45
Centralni mexoviti moment reda a+ b je
sab = E(
(X − E(X))a(Y − E(Y ))b)
=∑
i
∑
j
(xi − E(X))a(yj − E(Y ))bpij.
Kovarijansa je zapravo entralni mexoviti moment s11, a moe se izraziti
matematiqkim oqekivaima,
cov(X, Y ) = E ((X −E(X))(Y − E(Y ))) = E(XY )− E(X)E(Y ).
Koefi ijent korela ije sluqajnih promenivih X i Y je kovarijansa
dvodimenzionalne standardizovane sluqajne promenive (X∗, Y ∗),
ρXY = cov(X∗, Y ∗) =E(XY )−E(X)E(Y )
σ(X)σ(Y ). (1.21)
Vanost koefi ijenta korela ije proistiqe iz egovih osobina:
1
o
Ako su X i Y nezavisne onda je ρXY = 0, odnosno, X i Y su nekorelisane
sluqajne promenive.
6
2
o |ρXY | ≤ 1
3
o |ρXY | = 1 ako i samo ako su X i Y linearno povezane, Y = kX + n, za neke
k, n ∈ R, k 6= 0.
Koefi ijent korela ije odraava stepen linearne zavisnosti za X i Y . Ako je
0 < ρ < 1 onda su X i Y pozitivno korelisane a za negativno ρ su negativno
korelisane. Znak koefi ijenta korela ije ukazuje na rastuu ili opadajuu za-
visnost meÆu sluqajnim promenivama. Xto je |ρ| blie jedini i, zavisnost jeznaqajnija, a za |ρ| < 0.3 se kae da X i Y nisu u znaqajnoj korela iji.
Primer. Neka je (X, Y ) dvodimenzionalna sluqajna promeniva iz primera na
strani 39. eno matematiqko oqekivae i disperzija se raqunaju na osnovu
marginalnih raspodela (1.18),
E(X, Y ) = (E(X), E(Y )) = (1, 6.05),
D(X, Y ) = (E(X2)− E2(X), E(Y 2)− E2(Y )) = (0.6, 4.4475).
Za odreÆivae koefi ijenta korela ije potrebna je raspodela sluqajne promen-
ive XY :
XY :
(
0 2 4 5 8 9 10 16 18620
0 0 520
220
120
220
220
220
)
,
odakle je E(XY ) = 6.9. Dae se raquna na osnovu (1.21)
6
Obrnuto ne vai, postoje sluqajne promenive za koje je ρXY = 0 ali nisu nezavisne.
46 POGLAVE 1. VEROVATNOA
ρXY =6.9− 1 · 6.05√0.6√4.4475
≈ 0.85
0.77 · 2.11 = 0.52,
i zakuqak je da su X i Y znaqajno pozitivno korelisane.
1.4.6 Osnovne raspodele diskretnih sluqajnih promeni-
vih
Bie predstavene tri najqexe korixene diskretne sluqajne promenive sa
ihovim raspodelama i osnovnim karakteristikama.
Binomna raspodela, B(n, p)
Sluqajna promenivaX ima binomnu raspodelu sa parametrima n ∈ N i p ∈ (0, 1),
u ozna i X : B(n, p), ako je en skup vrednosti RX = 0, 1, . . . , n i odgovarajueverovatnoe se raqunaju na osnovu binomnih koefi ijenata i parametra p,
p(k) = P (X = k) =
(
n
k
)
pkqn−k, k ∈ RX , (1.22)
gde je q = 1− p.
Matematiqko oqekivae i standardno odstupae su
E(X) = np, σ(X) =√npq.
Analizirajui nejednakosti p(k − 1) ≤ p(k) i p(k) ≥ p(k + 1) zakuquje se da je
vrednost sa najveom verovatnoom p(k), odnosno modus, rexee sledee nejedna-
qine
np+ p− 1 ≤ k ≤ np+ p.
Verovatnoe u raspodeli su stalni opadajue ako je np + p < 1, a stalno rastue
u sluqaju np + p > n.
Binomna sluqajna promeniva je "model za izvlaqee sa vraaem". Na primer,
neka se u kutiji nalaze bele i rne kugli e, b belih i c rnih, ukupno b + c.
Verovatnoa da se u jednom izvlaqeu kugli e izvuqe bela je p = bb+c
. Ako se
izvlaqee sprovodi n puta, sa vraaem izvuqene kugli e u kutiju, onda slu-
qajna promeniva koja predstava broj izvuqenih belih kugli a ima binomnu
raspodelu X : B(n, p).TakoÆe, ako je poznato da se pri izvoÆeu eksperimenta dogaÆaj A realizuje sa
verovatnoom P (A), a eksperiment se ponava n puta, onda je broj eksperimenata
u kojima se A ostvario opisan binomnom raspodelom X : B(n, P (A)). Podrazumeva
se da se svako ponavae eksperimenta sprovodi nezavisno i pod istim uslovima.
1.4. SLUQAJNE PROMENIVE 47
Spe ijalan sluqaj je B(1, p), koji se jox naziva Bernulijeva raspodela. In-
dikator dogaÆaja IA je primer sluqajne promenive sa ovom raspodelom, jer pod-
razumeva jedno izvoÆee eksperimenta pri qemu se dogaÆaj od interesa ostvario
(taqno jednom) sa verovatnoom p, ili se nije ostvario.
U pomenutom primeru ba aa 3 novqia, sluqajna promeniva ima binomnu
raspodelu B(3, 0.5).Primer. Koxarkax je uspexan u izvoÆeu slobodnih ba aa sa verovatnoom
0.85. Broj postignutih koxeva u 10 slobodnih ba aa je opisan binomnom raspode-
lom B(10, 0.85). Verovatnoa da koxarkax postigne npr. 9 koxeva iznosi
p(9) =(
109
)
0.859 · 0.15 = 0.347.
Za velike vrednosti parametra n je veoma sloeno izraqunavae verovatnoa
binomne raspodele.
Poasonova raspodela, P(λ)
Sluqajna promeniva X ima Poasonovu raspodelu sa parametrom λ > 0, xto se za-
pisuje X : P(λ), ako je en skup vrednosti RX = 0, 1, 2, . . . , n, . . . i odgovarajueverovatnoe se odreÆuju na sledei naqin
p(k) = P (X = k) =λk
k!e−λ, k = 0, 1, . . . (1.23)
Matematiqko oqekivae i disperzija Poasonove raspodele su jednaki
E(X) = D(X) = λ.
Poasonova raspodela je graniqni sluqaj binomne raspodele, kada je broj ponav-
aa eksperimenta dovono veliko i p dovono malo.
Teorema 1.4.20 Ako X sluqajna promeniva ima binomnu raspodelu B(n, p) i
vai n→∞, p→ 0, ali tako da limn→∞
np = λ, onda je
limn→∞
(
n
k
)
pkqn−k =λk
k!e−λ, k = 0, 1, . . .
pa se verovatnoe mogu priblino raqunati
P (X = k) ≈ λk
k!e−λ, k = 0, 1, . . .
Praktiqno, binomna raspodela se aproksimira Poasonovom za vee vrednosti
parametra n jer su tada binomne verovatnoe nepodesne za izraqunavae, taqnije
kada je n ≥ 30 i np ≤ 10.
48 POGLAVE 1. VEROVATNOA
Poasonova sluqajna promeniva je dobar matematiqki model za pojave koje se
prebrojavaju u odreÆenom vremenskom intervalu: broj telefonskih poziva u toku
radnog vremena, dnevni broj pristiglih mejlova, broj pristiglih SMS-ova za sat
vremena, broj automobila koji proÆu datu taqku puta za fiksirano vreme, broj
dnevnih saobraajnih nezgoda u nekom gradu,...
Primer. Oqekivani broj mejlova u toku radnog vremena u nekoj firmi je 13.
Broj pristiglih mejlova je opisan Poasonovom raspodelom sa parametrom λ = 13.
Sluqajna promeniva koja predstava dnevni broj mejlova ima raspodelu P(13).Verovatnoa da e sutra stii taqno 7 mejlova je jednaka
P (X = 7) = 137
7!· e−13 = 0.028.
Geometrijaska raspodela, G(p)
Sluqajna promeniva X ima geometrijsku raspodelu sa parametrom p ∈ (0, 1)
ako je en skup vrednosti RX = N a odgovarajue verovatnoe se izraqunavaju
p(k) = P (X = k) = (1− p)k−1 · p, k = 1, 2, . . .
Matematiqko oqekivae i disperzija su
E(X) =1
p, D(X) =
1− p
p2.
Geometrijska sluqajna promeniva ima znaqaj u modelovau "ponavaa do
realiza ije" i predstava broj ponavaa eksperimenta do pozitivnog ishoda.
Koristi se i kod "izvlaqea sa vraaem" koje se ponava samo do "povonog"
izvlaqea.
Primer. Strela pogaÆa metu sa verovatnoom 0.65. Sluqajna promeniva
X : G(0.65) opisuje broj gaÆaa do pogotka u metu. Verovatnoa da strela metu
pogodi, na primer, tek iz sedmog pokuxaja je p(7) = 0.356 · 0.65.
1.4.7 Osnovne raspodele neprekidnih sluqajnih promen-
ivih
Ubedivo najzastupenija apsolutno neprekidna sluqajna promeniva je ona sa
normalnom raspodelom. Pored e, ovde e biti prikazane jox uniformna i ek-
sponen ijalna raspodela, a χ2(Hi-kvadrat) i Studentova raspodela e biti raz-
matrane u okviru statistike.
1.4. SLUQAJNE PROMENIVE 49
Uniformna raspodela, U(a, b)
Uniformna raspodela je odreÆena intervalom realnih brojeva (a, b), odnosno ima
dva parametra a, b ∈ R, a < b. Sluqajna promeniva X koja ima uniformnu
raspodelu, u ozna i X : U(a, b), je zadata gustinom.
Gustina za X : U(a, b) je
ϕX(x) =
1b−a
, x ∈ (a, b)
0, x /∈ (a, b).
Odgovarajua funk ija raspodele je
FX(x) =
0, x ≤ ax−ab−a
, x ∈ (a, b)
1, b ≤ x.
Gustina raspodele i funk ija raspodele prikazane su na sli i 1.11.
ϕ(x)
x
F (x)
xa b
1b−a
a b
1
Slika 1.11: Uniformna sluqajna promeniva, U(a, b)
Matematiqko oqekivae i disperzija uniformne sluqajne promenive su
E(X) =a+ b
2, D(X) =
(b− a)2
12.
Primer. Vreme dolaska broda u luku je sluqajan momenat izmeÆu 9 i 12 qasova.
Izraqunati verovatnou da brod stigne u luku izmeÆu 10 i 10:30 qasova.
Vreme dolaska broda se izraava sluqajnom promenivom koja ima uniformnu
raspodelu, X : U(9, 12) (jedini a mere je qas, h), i odreÆuje se verovatnoa da
sluqajna promeniva X uzme vrednost iz intervala (10, 10.5),
P (10 ≤ X ≤ 10.5) = F (10.5)− F (10) =10.5− 9
12− 9− 10− 9
12− 9=
1
6.
50 POGLAVE 1. VEROVATNOA
Eksponen ijalna raspodela, E(λ)
Kada sluqajna promeniva X ima eksponen ijalnu raspodelu sa parametrom λ >
0, zapisuje se X : E(λ).
Gustina za X : E(λ) je
ϕX(x) =
λe−λx, x ≥ 0
0, x < 0.
Odgovarajua funk ija raspodele je
FX(x) =
1− e−λx, x ≥ 0
0, x < 0.
Grafi i ovih funk ija su prikazani na sli i 1.12.
1 2 3
1
λ
x
ϕ(x)
1 2 3
1
x
F (x)
Slika 1.12: Gustina raspodele i funk ija raspodele, E(λ)
Matematiqko oqekivae i disperzija sluqajne promenive sa eksponen ijal-
nom raspodelom su
E(X) =1
λ, D(X) =
1
λ2.
Primer. Vreme (izraeno u satima) izmeÆu dolaska dva autobusa na stajalixte
gradske autobuske linije je opisano eksponen ijalnom raspodelom sa parametrom
0.75 sati, tj. X : E(0.75). Kolika je verovatnoa da e izmeÆu dolaska dva autobusaproi vixe od 15 minuta (0.25 qasa)?
P (X > 0.25) = 1− p(X < 0.25) = 1− F (0.25) = e−0.75·0.25 = e−0.1875 ≈ 0.83.
Normalna raspodela, N (m, σ)
Sluqajna promeniva X koja ima normalnu, Gausovu raspodelu sa parametrima
m ∈ R i σ > 0, se oznaqava X : N (m, σ).OdreÆena je gustinom,
ϕX(x) =1
σ√2π
e−(x−m)2
2σ2 , x ∈ R, (1.24)
1.4. SLUQAJNE PROMENIVE 51
a odgovarajua funk ija raspodele je
FX(x) =1
σ√2π
∫ x
−∞e−
(t−m)2
2σ2 dt. (1.25)
Napomena: Integral (1.25) se ne moe izraqunati. Numeriqkim metodama se
egove vrednosti priblino izraqunavaju.
−4 −2 2 4
1
x
ϕ(x)
−4 −2 2 4
0.5
1
x
F (x)
Slika 1.13: Gustina raspodele i funk ija raspodele za razliqite vrednosti para-
metara m i σ: N (0, 1), N (2, 0.5), N (2, 1.5).
Matematiqko oqekivae, modus i medijana normalne sluqajne promenive se
meÆusobno poklapaju i jednaki su prvom parametru, a disperziju i standardno
odstupae odreÆuje drugi parametar,
E(X) = mo = me = m, D(X) = σ2.
Grafik funk ije gustine raspodele normalne sluqajne promenive je Gausova
kriva sa karakteristiqnim oblikom zvona, kao na sli i 1.13. Gausova kriva je si-
metriqna u odnosu na pravu x = m i unimodalna je. Parametar σ odreÆuje visinu
temena gustine raspodele
(
m, 1σ√2π
)
kao i enu spoxtenost. Za male vrednosti
standardnog odstupaa poveava se kon entra ija verovatnoe oko matematiqkog
oqekivaa. Za sve vrednosti parametara vai
P (m− σ < X < m+ σ) = 68.3%
P (m− 1.96σ < X < m+ 1.96σ) = 95%
P (m− 2.58σ < X < m+ 2.58σ) = 99%
P (m− 3σ < X < m+ 3σ) = 99.7%.
Posleda jednakost je poznata kao pravilo tri sigme i znaqi da se skoro sve
vrednosti sluqajne promenive nalaze u intervalu (m− 3σ,m+3σ). Poda i koji
su van tog intervala se qesto smatraju pogrexnim.
52 POGLAVE 1. VEROVATNOA
Moe se pokazati da se standardiza ijom svaka normalna raspodelaX : N (m, σ)
transformixe u X∗ = (X−m)σ
: N (0, 1), pa se ona posebno imenuje kao standardna
normalna raspodela.
Laplasova funk ija ima veliki znaqaj za standardnu normalnu raspodelu
i definisana je
Φ(x) =1√2π
∫ x
0
e−t2
2 dt, x > 0. (1.26)
Znaqajne osobine Laplasove funk ije su:
1
o
Laplasova funk ija se proxiruje i na negativne brojeve,
Φ(−x) = −Φ(x)
2
o
Pojedine vrednosti Laplasove funk ije su:
Φ(0) = 0, x ≥ 3.5 ⇒ Φ(x) ≈ 0.5.
Φ(∞) = limx→∞
Φ(x) = 0.5, Φ(−∞) = limx→−∞
Φ(x) = −0.5
3
o
Za sluqajnu promenivu X : N (m, σ) funk ija raspodele se raquna
FX(x) =1
2+ Φ
(
x−m
σ
)
, x ∈ R,
pa se i verovatnoa moe izraziti direktno Laplasovom funk ijom,
P (a ≤ X < b) = P
(
a−m
σ≤ X∗ <
b−m
σ
)
= Φ
(
b−m
σ
)
− Φ
(
a−m
σ
)
.
Vrednosti Laplasove funk ije se raqunaju numeriqki i ene pribline vred-
nosti su date u tabeli 3.1 u Dodatku.
Normalna raspodela ima najvei znaqaj. Poznato je da ona opisuje vixe od
treine realnih pojava: karakteristike ivih bia (visina, teina, broj zrna
u klasu, broj pqela u koxni i, broj mladuna a u okotu, koefi ijent inteligen-
ije,...), podatke iz proizvode (dimenzije proizvoda, teina, kvalitet, kapa itet
maxina, potroxa energije,...), poslovae (visina zarade, zadovostvo uslugom,
zastupenost na trixtu...).
Primer. Dnevni broj posetila a muzeja se opisuje normalnom sluqajnom pro-
menivom sa oqekivanom vrednoxu 210 i standardnim odstupaem 25. Kolika
je verovatnoa da dnevni broj posetila a bude (a) vei od 200, (b) mai od 150,
(c) izmeÆu 205 i 234? (d) Za koji broj c se sa sigurnoxu 95% moe tvrditi da je
broj posetila a mai od c?
Neka je X sluqajna promeniva koja predstava dnevni broj posetila a muzeja.
1.4. SLUQAJNE PROMENIVE 53
Standardiza ija X∗ = X−21025
: N (0, 1) omoguava odreÆivae traenih vero-
vatnoa na osnovu Laplasove funk ije, taqnije tabele 3.1
(a) P (X > 200) = P
(
X∗ >200− 210
25
)
= P (X∗ > −0.4)
= P (−0.4 < X∗ <∞) = Φ(∞)− Φ(−0.4) = 0.5 + 0.1554
= 0.6554.
(b) P (X < 150) = P
(
X∗ <150− 210
25
)
= P (X∗ < −2.4)
= P (−∞ < X∗ < −2.4) = Φ(−2.4)− Φ(−∞) = −0.4918 + 0.5
= 0.0082.
(c) P (205 < X < 234) = P
(
205− 210
25< X∗ <
234− 210
25
)
= P (−0.2 < X∗ < 0.96)
= Φ(0.96)− Φ(−0.2) = 0.3315 + 0.0793
= 0.4108.
(d) Jednaqina koja odgovara postavenom pitau je P (−∞ < X < c) = 0.95, pa je
P (−∞ < X∗ <c− 210
25) = 0.95,
Φ
(
c− 210
25
)
= 0.95 + Φ(−∞) = 0.45,c− 210
25= Φ−1(0.45).
Vrednost 0.45 ne postoji u tabeli Laplasove funk ije, nego se kao najblie vred-
nosti nalaze 0.4495 i 0.4505. Uzima se
Φ−1(0.45) = 12(Φ−1(0.4495) + Φ−1(0.4505)) = 1
2(1.64 + 1.65)) = 1.645,
odakle sledi c = 210 + 1.645 · 25 = 251.125.
Sa sigurnoxu 95% se moe tvrditi da e muzej posetiti mae od 252 udi u
toku jednog dana.
1.4.8 Zakoni velikih brojeva i entralne graniqne teo-
reme
Zakoni velikih brojeva i entralne graniqne teoreme su dve osnovne grupe graniq-
nih teorema. Teoreme se nazivaju graniqne, jer posmatraju veliki broj sluqajnih
promenivih X1,X2,. . ., Xn, . . . a tvrde se odnose na graniqni sluqaj kada n→∞.
Neformalno, reqnikom statistike, kae se da se na osnovu uzorka (uzoraqkih
sluqajnih promenivih) moe zakuqivati o masovnoj pojavi, a xto je uzorak
obimniji zakuq i su validniji.
Zakoni velikih brojeva izuqavaju konvergen iju niza sluqajnih promenivih
ka konstanti. Ako se ko ki a za igru ba a 6 puta, ne moe se oqekivati da se
54 POGLAVE 1. VEROVATNOA
svaki od brojeva dobije taqno jednom. Ali ako se ko ki a ba a 6000 puta, svaki
od brojeva e se dobiti priblino 1000 puta.
Centralne graniqne teoreme razmatraju funk ije raspodela suma sluqajnih
promenivih i uslove koji obezbeÆuju ihovu konvergen iju ka normalnoj raspo-
deli. Na osnovu ove grupe teorema se, pod odreÆenim uslovima, raspodele mnogih
sluqajnih promenivih mogu aproksimirati standardnom normalnom raspodelom.
Uopxteno, graniqne teoreme omoguavaju primenu verovatnoe, pre svega u
izuqavau masovnih pojava. One su spona izmeÆu verovatnoe i statistike. Jedan
od kuqnih rezultata teorije verovatnoe koji se koristi u dokazima je nejed-
nakost Qebixeva koja e jedina ovde biti dokazana.
Teorema 1.4.21 (Nejednakost Qebixeva) Neka je X nenegativna sluqajna pro-
meniva za koju postoji E(X2). Onda za svako ǫ > 0 vai
P (X ≥ ǫ) ≤ E(X2)
ǫ2.
Dokaz. Ako je X diskretna sluqajna promeniva, dokaz se zasniva na jednostavnoj
qieni i da se dodavaem nenegativnih sabiraka vrednost sume poveava,
ǫ2 · P (X ≥ ǫ) = ǫ2∑
i:xi≥ǫ
p(xi) =∑
i:xi≥ǫ
ǫ2p(xi) ≤∑
i:xi≥ǫ
x2i p(xi)
≤∑
i:xi≥ǫ
x2i p(xi) +
∑
i:xi<ǫ
x2i p(xi) =
∑
i
x2i p(xi)
= E(X2).
Ako je X apsolutno neprekidna sluqajna promeniva, verovatnoa P (X ≥ ǫ) se
izraava integralom gustine raspodele ϕ (koja je nenegativna), a egova vrednost
se poveava proxirivaem intervala nad kojim se vrxi integra ija,
ǫ2 · P (X ≥ ǫ) = ǫ2∫
x≥ǫ
ϕ(x) dx =
∫
x≥ǫ
ǫ2ϕ(x) dx ≤∫
x≥ǫ
x2ϕ(x) dx
≤∫
x≥ǫ
x2ϕ(x) dx+
∫
x<ǫ
x2ϕ(x) dx =
∞∫
0
x2ϕ(x) dx
= E(X2).
Ako jeX proizvona sluqajna promeniva sa matematiqkim oqekivaem E(X),
onda sluqajna promeniva Y = |X − E(X)| ispuava uslove prethodne teoreme
i vai E(Y 2) = E ((X − E(X))2) = D(X). Tako se dobija ekvivalentna forma
nejednakosti Qebixeva
P (|X −E(X)| ≥ ǫ) ≤ D(X)
ǫ2.
1.4. SLUQAJNE PROMENIVE 55
Zakoni velikih brojeva
Neka je Xn | , n ∈ N = X1,X2,. . ., Xn, . . . niz sluqajnih promenivih nad is-
tim prostorom verovatnoe qija matematiqka oqekivaa postoje i oznaqena su
E(X1),. . .,E(Xn), . . .. Transformisaem se formira novi niz sluqajnih promen-
ivih
Y1 = X1 −E(X1)
Y2 = 12(X1 +X2)−E
(
12(X1 +X2)
)
= 12(X1 +X2)− 1
2(E(X1) + E(X2))
Y3 = 13(X1 +X2 +X3)− 1
3(E(X1) + E(X2) + E(X3))
.
.
.
Yn = 1n
n∑
i=1
Xi − 1n
n∑
i=1
E(Xi)
.
.
.
Zakoni velikih brojeva (ZVB) razmatraju konvergen iju niza Yn |n ∈ N ka 0. Unastavku se navode samo slabi zakoni velikih brojeva: ne analizira se direktno
konvergen ija niza, nego se pokazuje da je za dovono veliko n, dogaÆaj da se Yn
znaqajno razlikuje od 0, praktiqno nemogu.
Teorema 1.4.22 (ZVB Qebixeva) Ako je Xn |n ∈ N niz nezavisnih sluqajnih
promenivih i postoji konstanta C > 0 tako da D(Xi) ≤ C, i = 1, 2, . . ., onda
za svako ε > 0 vai
limn→∞
P
(∣
∣
∣
∣
∣
1
n
n∑
i=1
Xi −1
n
n∑
i=1
E(Xi)
∣
∣
∣
∣
∣
≥ ε
)
= 0.
Teorema 1.4.23 (ZVB Hinqina) Ako je Xn |n ∈ N niz nezavisnih sluqajnih
promenivih sa istom raspodelom i konaqnim matematiqkim oqekivaem E(Xi) =
a, i = 1, 2, . . ., onda za svako ε > 0 vai
limn→∞
P
(∣
∣
∣
∣
∣
1
n
n∑
i=1
Xi − a
∣
∣
∣
∣
∣
≥ ε
)
= 0.
Ako se prethodna teorema primeni na niz sluqajnih promenivih sa istom Bernuli-
jevom raspodelom, dobija se sledee tvrÆee:
Teorema 1.4.24 Neka je Xn |n ∈ N niz nezavisnih sluqajnih promenivih sa
istom Bernulijevom raspodelom Xi :
(
0 1
1− p p
)
, p ∈ (0, 1). Tada za svako ε > 0
vai:
56 POGLAVE 1. VEROVATNOA
• nejednakost
P
(∣
∣
∣
∣
∣
1
n
n∑
i=1
Xi − p
∣
∣
∣
∣
∣
< ε
)
> 1− p(1− p)
nε2,
• Bernulijev ZVB
limn→∞
P
(∣
∣
∣
∣
∣
1
n
n∑
i=1
Xi − p
∣
∣
∣
∣
∣
≤ ε
)
= 1.
Primer. Iz xpila sa 52 karte se izvlaqi jedna karta na sluqajan naqin i reg-
istruje se da li ona ima znak tref. Eksperiment se ponava 10000 puta (svaka
izvuqena karta se vraa u xpil). (a) Odrediti verovatnou da je razlika rela-
tivne frekven ije posmatranog dogaÆaja i broja 0.25, maa od 0.01. (b) Koliko
puta treba ponoviti eksperiment da bi se sa verovatnoom bar 0.95 moglo tvrditi
da e posmatrana razlika biti maa od 0.01?
Pojedinaqno izvlaqee karte ima Bernulijevu raspodelu sa parametrom p = 14=
0.25. Sluqajna promeniva
1n
n∑
i=1
Xi je jednaka relativnoj frekven iji, pa se
neposrednom primenom prethodne teoreme dobija
(a) P
(∣
∣
∣
∣
∣
1
10000
10000∑
i=1
Xi − 0.25
∣
∣
∣
∣
∣
< 0.01
)
> 1− 0.25 · 0.7510000 · 0.012 = 1− 0.1875 = 0.8125.
(b) P
(∣
∣
∣
∣
∣
1
n
n∑
i=1
Xi − 0.25
∣
∣
∣
∣
∣
< 0.01
)
> 1− 0.25 · 0.75n · 0.012 ,
odakle se na osnovu uslova dobija nejednaqina
1− 0.25 · 0.75n · 0.012 ≥ 0.95, qije je rexee n ≥ 37500.
Centralne graniqne teoreme
U iu formulisaa entralnih graniqnih teorema se za niz meÆusobno nezav-
isnih sluqajnih promenivih Xn |n ∈ N formira niz suma Sn |n ∈ N,
S1 = X1
S2 = X1 +X2
.
.
.
Sn = X1 +X2 + . . .+Xn
.
.
.
(1.27)
Centralne graniqne teoreme daju uslove pod kojima funk ija raspodele sluqa-
jne promenive Sn tei ka normalnoj raspodeli za n→∞. Sledi jedno od najop-
xtijih tvrÆea.
1.4. SLUQAJNE PROMENIVE 57
Teorema 1.4.25 Neka je Xn |n ∈ N niz nezavisnih sluqajnih promenivih kojeimaju konaqna matematiqka oqekivaa E(Xi) = ai i disperzije D(Xi) = σ2
i ,
i = 1, 2, . . . Ako je
limn→∞
maxi∈1,...,n
σ2i
n∑
i=1
σ2i
= 0,
onda za svaki realan broj x ∈ R vai
limn→∞
P
n∑
i=1
Xi −n∑
i=1
ai√
n∑
i=1
σ2i
< x
=1√2π
x∫
−∞
e−t2
2 dt.
Ako se pretpostavi da sve sluqajne promenive Xn |n ∈ N imaju istu raspo-delu sa konaqnim matematiqkim oqekivaem E(Xi) = a i disperzijom D(Xi) = σ2
,
i = 1, 2, . . ., onda u graniqnom sluqaju, za dovono veliko n, formirane sluqa-
jne promenive (1.27) imaju raspodele koje se mogu aproksimirati normalnim
raspodelama
Sn : N (na, σ√n).
Za vee vrednosti n aproksima ije su taqnije.
Najqexe korixena entralna graniqna teorema se odnosi na niz standard-
izovanih suma
S∗n =
Sn − na
σ√n
, n ∈ N, (1.28)
koje za dovono veliko n imaju raspodelu N (0, 1).
Teorema 1.4.26 Neka je Xn |n ∈ N niz nezavisnih sluqajnih promenivih
koje imaju istu raspodelu sa konaqnim matematiqkim oqekivaem E(Xi) = a
i D(Xi) = σ2, i = 1, 2, . . . Tada za svaki realan broj x ∈ R vai
limn→∞
P (S∗n < x) =
1√2π
x∫
−∞
e−t2
2 dt,
gde je S∗n dato u (1.28).
Sledea teorema omoguava aproksima iju binomne raspodele normalnom.
Teorema 1.4.27 Neka je Xn |n ∈ N niz nezavisnih sluqajnih promenivih sa
istom Bernulijevom raspodelom, Xn :
(
0 1
q p
)
, p ∈ (0, 1), q = 1− p. Tada vai:
• Sluqajna promeniva Sn ima binomnu raspodelu, Sn : B(n, p),
58 POGLAVE 1. VEROVATNOA
• (Lokalna Moavr-Laplasova teorema) Ako je k ∈ 0, 1, . . . , n takvo da
k−np√npq
pripada konaqnom intervalu, onda
limn→∞
√npq · P (Sn = k) =
1√2π
e−(k−np)2
2npq .
Za dovono veliko n, vai priblina jednakost
P (Sn = k) ≈ 1√npq√2π
e−(k−np)2
2npq .
• (Integralna Moavr-Laplasova teorema)
limn→∞
P
(
a <Sn − np√
npq< b
)
=1√2π
b∫
a
e−t2
2 dt.
Praktiqno, aproksima ija binomne raspodele normalnom se primeuje ako je
n > 30 i pritom np > 10.
Primer. Pravilan novqi se ba a 10000 puta i registruje se da li je sa gore
strane glava ili pismo. (a) Kolika je verovatnoa da se pismo dobije 5050 puta?
(b) Kolika je verovatnoa da broj dobijenih pisama bude izmeÆu 4900 i 5050?
Broj dobijenih pisama u 10000 ba aa novqia je opisan sluqajnom promenivom
S10000 : B(10000, 0.5). Na osnovu enih numeriqkih karakteristika je E(S10000) =
np = 500 i σ =√npq = 50. Primenom prethodne teoreme se dobija:
(a) P (S10000 = 5050) ≈ 1√
10000 · 1212
√2π· e−
(5050−5000)2
2·10000· 1212
=1
50
1√2π
e−12 ≈ 1
50· 0.242
= 0.00484
(b) P (4900 < S10000 < 5050) = P
(
4900− 5000
50< S∗
10000 <5050− 5000
50
)
= P (−2 < S∗10000 < 1)
= Φ(1)− Φ(−2) = Φ(1) + Φ(2)
= 0.3413 + 0.4772
= 0.8185.
Zbog primena u statistiqkim istraivaima, od interesa je za niz nezavis-
nih sluqajnih promenivih Xn |n ∈ N formirati niz aritmetiqkih sredina
1.4. SLUQAJNE PROMENIVE 59
Xn |n ∈ N,X1 = X1
X2 =12(X1 +X2) =
12S2
.
.
.
Xn = 1n(X1 +X2 + . . .+Xn) =
1nSn
.
.
.
Ako sve sluqajne promenive imaju istu raspodelu sa konaqnim matematiqkim
oqekivaem E(Xi) = a i disperzijom D(Xi) = σ2, i = 1, 2, . . ., onda se raspodele
za Xn mogu aproksimirati normalnom raspodelom
Xn : N(
a,σ√n
)
.
60 POGLAVE 1. VEROVATNOA
Poglave 2
Statistika
Statistika kao nauqna dis iplina prouqava masovne pojave, qak se i definixe
kao skup matematiqkih metoda kojima se analiziraju masovne pojave sa iem
odreÆivaa zakonitosti, i dae sa iem predviÆaa. Matematiqka statistika
je nauqna oblast koja prouqava varijabilne masovne pojave. Varijabilnost znaqi
promenivost, i ta promenivost je posledi a zavisnosti pojave od razliqitih
faktora, a ogleda se u odstupau vrednosti pojedinih sluqajeva od opxtih karak-
teristika pojave. Pri tome, statistika se ne bavi zavisnostima i razlozima, nego
samo analizira ostvarene vrednosti pojave i uoqava zakonitosti.
Statistiqka analiza je kvantitativnog karaktera i en osnovni prin ip je
uopxtavae, od pojedinaqnog ka opxtem. Na osnovu analize pojedinaqnih sluqa-
jeva donose se zakuq i o mnoxtvu.
Predmet istraivaa statistike je skup jednorodnih elemenata, u smislu da
svi egovi elementi poseduju neku zajedniqku osobinu, ali ene vrednosti za
pojedinaqne elemente se razlikuju mae ili vixe. Na velikim skupovima se
uoqavaju zakonitosti za te vrednosti i ihova odstupaa.
Statistika obuhvata prikupae i obradu podataka radi sti aa odreÆenih
saznaa o pojavi i donoxea nauqnih i praktiqnih zakuqaka. Tako, statistika
ima dve osnovne oblasti:
• Deskriptivna statistika - opisuje podatke, odreÆena je postup ima koji se
sprovode sledeim redosledom: prikupae podataka, grupisae i prikaz
podataka, obrada podataka i statistiqko zakuqivae
• Inferen ijalna statistika - zakuquje o nepoznatim aspektima masovne po-
jave, bavi se predviÆaima i razmatraem pretpostavki. Obiqno je nastavak
deskriptivne statistike, ako ima dovono informa ija.
Elementi statistike koji se razmatraju u ovom poglavu su bazirani na ve
uvedenim pojmovima verovatnoe. Prikazuje se statistiqko istraivae kroz sve
61
62 POGLAVE 2. STATISTIKA
egove etape: definisae problema, planirae i odabir metoda, prikupae
podataka, obrada i statistiqka analiza podataka, i sagledavae neoqiglednih
aspekata pojave primenom razliqitih metoda.
2.1 Osnovni pojmovi statistike
Osnovni pojmovi statistike su popula ija, obeleje i uzorak.
Popula ija je osnovni skup, generalna kolek ija elemenata qija se svojstva
posmatraju u svrhu izuqavaa statistiqke pojave. Popula ija moe sadrati ko-
naqno ili beskonaqno elemenata. Sa stanovixta teorije verovatnoe, popula ija
odgovara prostoru elementarnih dogaÆaja Ω.
Obeleje je zajedniqka odlika svih elemenata popula ije. Obeleje je po-
java koja se posmatra, meri, ispituje; ono je u fokusu statistiqkog istraivaa.
Po vrednostima koje uzima, obeleje moe biti kvalitativno (atributivno) ili
kvantitativno (numeriqko). MeÆutim, zbog lakxe primene matematiqkog alata,
i atributivno obeleje se izraava brojevima. Tako, obeleje svakom elementu
popula ije dodeuje brojnu vrednost pa se moe posmatrati kao sluqajna promen-
iva. Zato se i obeleava X , Y ,. . .
Obeleje smatramo poznatim ako je poznata egova raspodela: funk ija ras-
podele ili oblik raspodele i eni parametri. Ci statistiqkog istraivaa
je da, xto je mogue pre iznije, odredi skup vrednosti koje obeleje moe da uzme
X(ω) |ω ∈ Ω i odgovarajuu raspodelu verovatnoa.Numeriqke karakteristike obeleja se nazivaju parametri, i ihove vred-
nosti treba xto pre iznije pro eniti.
Obeleje popula ije se moe ispitivati potpuno (kada se analiziraju e-
gove vrednosti za svaki element popula ije) ili delimiqno (kada se analizira
samo podskup popula ije). U prvom sluqaju su rezultati i zakuq i taqniji, ali
pro es moe da bude dugotrajan, skup ili qak nemogu zbog prevelikog broja ele-
menata u popula iji. Veina statistiqkih istraivaa se sprovodi nad delom
popula ije.
Uzorak je podskup popula ije na kome se obeleje prouqava. Pre iznije,
to je deo popula ije na kome se prikupaju poda i za statistiqko istraivae.
Uzorak je konaqan, bez obzira na veliqinu popula ije (konaqna, prebrojiva ili
2.1. OSNOVNI POJMOVI STATISTIKE 63
neprebrojiva). Osnovna veliqina koja karakterixe uzorak je broj egovih eleme-
nata, i naziva se obim uzorka, n. Ako je n < 30 onda se za uzorak kae da je
mali, a u sluqaju n ≥ 30 se radi o velikom uzorku.
Obim uzorka se odreÆuje u skladu sa potrebama i mogunostima statistiqkog
istraivaa. Ako se zahteva vea taqnost, obim uzorka je vei, ali je istrai-
vae sporije i skupe. Uobiqajeno je da uzorak obuhvati 5% − 10% popula ije
(ako je ona konaqna).
Ci statistiqkog istraivaa je da se na osnovu podataka o obeleju priku-
penih u uzorku, izvedu zakuq i o obeleju nad elom popula ijom. Relevant-
nost ovog zakuqivaa zavisi od reprezentativnosti uzorka, koja se postie
na sledei naqin:
• svaki element popula ije ima jednaku xansu da uÆe u uzorak• uzorak je dovono velikog obima• potrebno je odba iti subjektivne faktore pri odabiru elemenata za uzorakxto se postie sluqajnim odabirom.
Ovakav uzorak se jox naziva i sluqajni uzorak.
Statistiqki eksperiment je odabir pojedinaqnog elementa iz popula ije
u uzorak. Ako je obim uzorka n, onda se sprovodi n nezavisnih statistiqkih
eksperimenata. Uzorak se obeleava
(X1, X2, . . . , Xn)
i predstava n-dimenzionalnu sluqajnu promenivu. i-ta komponenta uzorka Xi
je sluqajna promeniva i ona odraava vrednost obeleja na odabranom elementu
popula ije. Osnovna pretpostavka je da sve sluqajne promenive iz uzorka imaju
identiqnu raspodelu kao i samo obelejeX . Takav uzorak se naziva prost sluqa-
jan uzorak. Dakle, prost sluqajan uzorak je n-dimenzionalna sluqajna promen-
iva qije sve komponente imaju istu raspodelu i meÆusobno su nezavisne.
Ako je fiksiran prost sluqajni uzorak obima n i ako je sprovedeno n neza-
visnih statistiqkih eksperimenata, onda su odabrani elementi popula ije koji
ulaze u uzorak ω1, ω2, . . . , ωn ⊂ Ω. Vrednosti obeleja za elemente u uzorku qine
realizovani uzorak:
(x1, x2, . . . , xn) = (X1(ω1), X2(ω2), . . . , Xn(ωn)).
Za jednu popula iju, jedno obeleje i jedan prost sluqajan uzorak, postoji vixe
realizovanih uzoraka.
Pored prostog sluqajnog uzorka postoje i stratifikovani uzor i i klaster
uzor i. Uopxte, postup ima za formirae uzoraka i ihovim karakteristikama
se bavi teorija uzorkovaa.
64 POGLAVE 2. STATISTIKA
2.2 Analiza uzorka. Empirijska funk ija ras-
podele. Statistike
Statistiqko istraivae obeleja X u popula iji Ω se sprovodi analizom pros-
tog sluqajnog uzorka (X1, X2, . . . , Xn). Ci je da se xto pre iznije odredi ras-
podela obeleja X , pre svega eni parametri, od kojih su najvaniji entralna
vrednost raspodele E(X) i disperzija D(X).
Analiza uzorka U = (X1, X2, . . . , Xn) je odreÆivae egovih numeriqkih karak-
teristika koje e posluiti u pro eivau parametara obeleja. Numeriqke
karakteristike uzorka slue kao pro ene odgovarajuih parametara obeleja qi-
tave popula ije. One su odreÆene raspodelom podataka u uzorku, koja je opisana
empirijskom funk ijom raspodele.
Defini ija 2.2.1 Empirijska
1
funk ija raspodele F ∗n : R→ [0, 1] prostog sluqa-
jnog uzorka (X1, X2, . . . , Xn) je
F ∗n(x) =
Nx
n, x ∈ R,
gde je Nx broj sluqajnih promenivih iz uzorka qija je vrednost maa
2
od x.
Broj F ∗n(x) predstava relativnu uqestalost dogaÆaja (X < x) u n ponovenih
statistiqkih eksperimenata.
Zakon velikih brojeva potvrÆuje da je za dovono veliko n, empirijska raspo-
dela bliska raspodeli obeleja X na eloj popula iji. Time je omogueno da se
parametri obeleja aproksimiraju empirijskim vrednostima odgovarajuih uzo-
raqkih statistika.
Analiza uzorka se vrxi pomou raznih brojnih vrednosti koje se mogu dobiti
na osnovu prostog sluqajnog uzorka, pre iznije analiza se vrxi raznim trans-
forma ijama prostog sluqajnog uzorka.
Ako je g : Rn → R realna funk ija sa n argumenata, onda je g(X1, X2, . . . , Xn)
transforma ija n-dimenzionalne sluqajne promenive u obiqnu, jednodimenzio-
nalnu.
Defini ija 2.2.2 Statistika je funk ija uzorka
Y = g(X1, X2, . . . , Xn)
1
iskustvena, na osnovu podataka
2
Ako se za Nx uzme broj sluqajnih promenivih iz uzorka qija vrednost nije vea od x, onda
se dobija empirijska funk ija raspodele koja ima vei praktiqni znaqaj.
2.2. ANALIZA UZORKA 65
koja ne zavisi ekspli itno od parametara obeleja, a kojom se blie odreÆuje
egova empirijska raspodela. Jox se naziva i uzoraqka sluqajna promeniva.
Statistike se, po parametru koji blie odreÆuju, svrstavaju u grupe:
• Mere srede vrednosti - ukazuju na entralnu vrednost raspodele, to su
statistike bliske matematiqkom oqekivau obeleja X : uzoraqka arit-
metiqka sredina, uzoraqka geometrijska sredina, uzoraqka harmonijska sre-
dina;
• Mere pozi ije - statistike koje se odreÆuju na osnovu pozi ije u raspodeli,takoÆe ukazuju na entralne vrednosti raspodele: modus, medijana, kvar-
tili;
• Mere odstupaa - statistike koje ukazuju na disperziju obeleja, odstupaevrednosti realizovanog uzorka od entralne vrednosti: uzoraqka disperz-
ija, korigovana uzoraqka disperzija, srede apsolutno odstupae, koefi i-
jent varija ije, interval varija ije;
• Mere oblika raspodele - statistike na osnovu kojih se raspodela obeleja
X poredi sa normalnom raspodelom: koefi ijent asimetrije, koefi ijent
spoxtenosti.
Najqexe korixene statistike su uzoraqka aritmetiqka sredina i uzoraqka
disperzija
Xn =1
n
n∑
i=1
Xi, S2
n =1
n
n∑
i=1
(Xi −Xn)2 =
1
n
n∑
i=1
X2i − X
2
n. (2.1)
Matematiqko oqekivae aritmetiqke uzoraqke sredine se poklapa sa matematiqkim
oqekivaem obeleja X , a matematiqko oqekivae uzoraqke disperzije je propor-
ionalno disperziji obeleja X ,
E(
Xn
)
= E(X), E(
S2
n
)
=n− 1
nD(X),
tako da je opravdana upotreba ovih statistika za pro enu parametara obeleja X
nad elom popula ijom.
Statistika tek nakon sprovedenih statistiqkih eksperimenata moe dobiti
brojnu vrednost. Tako vrednosti jedne iste statistike za razliqite realizovane
uzorke mogu biti razliqite.
Primer. Statistiqko istraivae se sprovodi sa iem sagledavaa zastu-
penosti stranih turista u skijaxkom entru. Jasno, popula iju qine svi pri-
sutni turisti, a obeleje je "strana ". Ako je kapa itet ski- entra 10000 gostiju,
za obim uzorka se moe uzeti 1000. Relativna frekven ija strana a u uzorku e
predstavati verovatnou stranih turista. MeÆutim, ako iztraivae sprovodi
66 POGLAVE 2. STATISTIKA
pet statistiqara, svako e imati drugaqiji realizovani uzorak, jer e anketi-
rati razliqitih 1000 turista, i samim tim svako od ih e doi do drugaqijeg
zakuqka.
Obeleje "strana " X ima Bernulijevu raspodelu sa nepoznatom verovatnoom
p koja predstava zastupenost. Pretpostavka je da svaki turista, kao poten-
ijalni element uzorka Xi, i = 1, 2, . . . , 1000 jeste strana sa verovatnoom p.
Upotrebena statistika koja odgovara relativnoj frekven i je Y = 11000
1000∑
i=1
Xi.
Svako od statistiqara e u realizovanom uzorku imati drugaqiji broj i ras-
pored jedini a i nula, i stoga se zakuq i mogu razlikovati. O tome qiji je
zakuqak "taqniji" ne moe se raspravati, jer je statistika funk ija realizo-
vanog uzorka. Ali, ako se obim uzorka poveava, zakuq i e se mae razlikovati
(xto objaxavaju i entralne graniqne teoreme).
2.3 Raspodele znaqajne u statistiqkim istrai-
vaima
Pored normalne raspodele, u statisti i su od velike vanosti jox dve raspo-
dele, χ2(izgovara se "Hi kvadrat") i Studentova. Obe su definisane pomou
Gama funk ije Γ(x) koja ima veliki znaqaj i van statistike. Gama funk ija
je proxiree faktorijela (definisanog za prirodne brojeve) na sve pozitivne
brojeve
Γ(x) =
∞∫
0
tx−1e−t dt, x > 0,
i ima sledee osobine:
1
o Γ(1) = 1
2
o Γ(n) = (n− 1)!, n ∈ N
3
o Γ(
12
)
=√π
4
o Γ(x+ 1) = x · Γ(x), x > 0.
U statisti i su od posebnog znaqaja vrednosti Gama funk ije Γ(
n2
)
, za prirodne
brojeve n ∈ N.
χ2n-raspodela. Sluqajna promeniva X ima χ2
-raspodelu sa n stepeni slo-
bode, xto se oznaqava X : χ2n, ako je ena gustina raspodele zadata na sledei
2.3. RASPODELE ZNAQAJNE U STATISTIQKIM ISTRAIVAIMA 67
naqin:
ϕ(x) =
1
2n2 Γ(
n2
)xn2−1e−
x2 , x > 0
0, x ≤ 0.
Broj stepeni slobode n je parametar ove raspodele i jeste prirodan broj. U sluqaju
n = 2, ova raspodela se svodi na eksponen ijalnu raspodelu E(12).
Matematiqko oqekivae i disperzija χ2n-raspodele zavise od broja stepeni slo-
bode,
E(X) = n, D(X) = 2n.
Teorema 2.3.1 Standardizovana sluqajna promeniva koja ima χ2raspodelu sa n
stepeni slobode, X : χ2n, se za dovono velik stepen slobode n moe aproksimi-
rati normalnom raspodelom N (0, 1),
P
(
X − n√2n
< x
)
−→ 1√2π
x∫
−∞
e−t2
2 dt, kada n→∞.
U praksi se obiqno za uzorke velikog obima verovatnoe P (χ2n < x) odreÆuju na
osnovu normalne raspodele N (0, 1).
Studentova raspodela, tn. Sluqajna promeniva T ima Studentovu t-raspodelu
sa n stepeni slobode, ako je ena gustina raspodele definisana na sledei naqin:
ϕ(x) =Γ(
n+12
)
√nπΓ
(
n2
)
(
1 +x2
n
)−n+12
, x ∈ R. (2.2)
Matematiqko oqekivae i disperzija Studentove tn-raspodele (za n > 2) su
E(T ) = 0, D(T ) =n
n− 2.
Teorema 2.3.2 U graniqnom sluqaju, n→∞, Studentova raspodela tei stan-
dardizovanoj normalnoj raspodeli N (0, 1).
U statistiqkim istraivaima je vano znati kakvu raspodelu imaju statis-
tike koje se formiraju za prost sluqajni uzorak. Raspodela uzoraqke aritmetiqke
sredine je odreÆena prethodno navedenim tvrÆeima i entralnim graniqnim teo-
remama.
68 POGLAVE 2. STATISTIKA
U analizi uzorka, najvanije statistike su date u (2.1) i vano je sagledati
ihove raspodele. Neka obeleje X ima normalnu raspodelu N (m, σ). Na os-
novu entralnih graniqnih teorema, uzoraqka aritmetiqka sredinaXn ima takoÆe
normalnu raspodelu N(
m,σ√n
)
. Standardiza ija daje sluqajnu promenivu sa
standardizovanom normalnom raspodelom,
Xn −m
σ
√n : N (0, 1). (2.3)
Raspodelu uzoraqke disperzije nije mogue direktno odrediti, ali se moe pokazati
da skalirana uzoraqka disperzija
n
σ2S2
n ima χ2-kvadrat raspodelu sa n−1 stepeni
slobode, χ2n−1.
Pored ovih, od znaqaja je i statistika
Xn −m
Sn
√n− 1,
koja ima Studentovu tn−1-raspodelu i ima veliku primenu u intervalnom o ei-
vau nepoznatog parametra kao i kod testiraa statistiqkih hipoteza, u sluqaju
da je statistiqko istraivae zasnovano na uzorku malog obima.
2.4 Poda i. Grupisae i prikaz. Frekven ije
Poda i u statistiqkom istraivau su vrednosti obeleja dobijene u reali-
zovanom uzorku. Tip podataka koji se obraÆuju zavisi od prirode posmatranog
obeleja. Tako, poda i mogu biti:
• diskretni - potiqu od obeleja qije vrednosti su diskretne i iskazuju se
brojevima iz skupa Z,
• neprekidni - vrednosti neprekidnog obeleja su brojevi iz nekog intervala,a jedini a mere je deiva.
Diskretna obeleja su, na primer, o ena na ispitu, dnevni broj telefonskih
poziva, broj putnika u autobusu... Neprekidna obeleja su: proseqna o ena stu-
denta, vreme trajaa telefonskog razgovora, meseqna zarada, visina, teina...
Ponekad se iz praktiqnih razloga i neprekidna obeleja diskretizuju. Na
primer, duinu puta je dovono izraziti ( elim) brojem metara, temperaturu
sponog vazduha ( elim) brojem stepeni. A zapravo, duina jeste neprekidno
obeleje jer moe biti izmerena sa proizvonom taqnoxu (fiksiraem broja
de imalnih ifara i jedini e mere).
2.4. PODACI. GRUPISAE I PRIKAZ. FREKVENCIJE 69
Statistiqki poda i se prikupaju iz razliqitih izvora: iz dokumenata, an-
keta, posmatraem, mereem... Navode se po redosledu prikupaa i nazivaju se
negrupisani, neureÆeni, sirovi poda i.
Grupisae podataka. Poda i se grupixu radi boe preglednosti, jer je
obim uzorka n qesto velik. Poda i se mogu grupisati na dva naqina:
− po vrednostima xi, i = 1, . . . , k, k ≤ n,
− po intervalima Ii = [ai−1, ai), i = 1, . . . , k, k < n.
Broj elemenata u svakoj grupi je apsolutna frekven ija, fi, i = 1, . . . , k. Grupi-
sae mora biti is rpno (svaki podatak se mora svrstati u neku grupu) i iskuqivo
(svaki podatak se moe nai u samo jednoj grupi) i zato je zbir svih apsolutnih
frekven ija jednak obimu uzorka,
f1 + f2 + . . .+ fn = n.
Diskretni poda i se obiqno grupixu po vrednostima, a za neprekidno obeleje
su prosti poda i najqexe veoma raznovrsni, pa je grupisae po vrednostima
nepraktiqno.
Prilikom grupisaa vrednosti realizovanog uzorka po intervalima, od kuq-
nog je znaqaja odreÆivae broja intervala i ihovih grani a. Ako intervali nisu
prirodno nametnuti, ihov broj k se u praksi najqexe odreÆuje Sturgesovim
pravilom i zavisi samo od obima uzorka,
1 + 3.322 log10 n ≤ k ≤ 5 log10 n.
Xirina intervala se odreÆuje na sledei naqin
3
:
h =xmax − xmin
k,
a za grani e intervala se uzimaju brojevi jednostavni za rad ( eli, ra ionalni,...).
Grupisau moe da prethodi ureÆivae podataka u neopadajui niz, koji se
naziva varija ioni niz.
Grupisani poda i se nazivaju statistiqka serija ili raspodela podataka
i sadre informa ije oblika
(xi, fi), i = 1, . . . , k; ili (Ii, fi), i = 1, . . . , k.
Ako se nazivom naglaxava koji je sluqaj, koriste se termini prosta statistiqka
serija i intervalna statistiqka serija.
3
Razmatraju se samo intervali jednakih xirina, iako se u nekim statistiqkim istraiva-
ima poda i grupixu i intervale razliqitih xirina.
70 POGLAVE 2. STATISTIKA
Rekonstruk ija realizovanog uzorka na osnovu statistiqke serije je delimiqno
mogua. Na osnovu intervalne statistiqke serije se moe napraviti niz duine
n koji sve vrednosti iz intervala Ii predstava sredinom tog intervala, koja se
jox naziva glavni predstavnik intervala,
xsi =xi + xi+1
2. (2.4)
Pored apsolutne frekven ije, znaqajna su jox tri pojma koja ukazuju na uqes-
talost podataka:
• zbirna4 apsolutna frekven ija nxi=∑
a≤i
fa = f1+ f2+ · · ·+ fi, nxk= n
• relativna frekven ija f ∗i = fi
n,
k∑
i=1
f ∗i = 1
• zbirna relativna frekven ija n∗xi=∑
a≤i
f ∗a = f ∗
1 + f ∗2 + · · ·+ f ∗
i .
Relativne frekven ije u raspodeli podataka odgovaraju verovatnoama u ras-
podeli sluqajne promenive, a zbirna relativna frekven ija funk iji raspo-
dele.
Prikaz podataka. Praktiqno je raspodelu podataka prikazati tabelarno
i grafiqki. Tabela sadri dve kolone (ili vrste) u koje se unose vrednosti,
odnosno intervali, i odgovarajue frekven ije raspodele podataka. Grafiqki se
raspodela podataka najqexe prikazuje poligonalnom linijom ili histogramom u
koordinatnom sistemu gde horizontalna osa prikazuje vrednosti obeleja a ver-
tikalna osa prikazuje frekven ije. Na grafik se unose poda i iz proste, odnosno
intervalne statistiqke serije.
Primer. O ene i proseqne o ene studenata. Kod 20 studenata druge godine
je evidentirana o ena dobijena na ispitu iz matematike:
(9, 7, 8, 6, 8, 9, 10, 10, 8, 7, 8, 8, 10, 7, 7, 9, 6, 7, 7, 8),
i proseqna o ena po zavrxetku prve godine studija
(7.23, 9.34, 9.63, 8.75, 6.95, 7.92, 9.10, 9.25, 8.65, 7.95,
8.25, 9.10, 8.75, 8.15, 7.23, 7.95, 6.74, 8.25, 8.75, 9.10).
Poda i iz prvog niza su diskretni pa se grupixu po vrednostima, a iz drugog niza
po intervalima. Odgovarajue raspodele podataka se mogu prikazati u tabelama
i grafiqki:
4
Qesto upotrebavan sinonim je "kumulativna"
2.4. PODACI. GRUPISAE I PRIKAZ. FREKVENCIJE 71
Statistiqka serija, dobijena
grupisaem podataka, prikazana
je tabliqno, sa dodatno iskazanim
zbirnim frekven ijama
xi 6 7 8 9 10
fi 2 6 6 3 3
nxi2 8 14 17 20
6 7 8 9 10
23
68
14
17
20
x
f ,nxi
Tabela 2.1: O ene studenata
U tabeli su prikazane rela-
tivne frekven ije i zbirne re-
lativne frekven ije koje upuuju
na empirijsku raspodelu i odgo-
varajuu funk iju raspodele.
xi 6 7 8 9 10
f ∗i
220
620
620
320
320
n∗xi
220
820
1420
1720
2020
6 7 8 9 10
0.1
0.30.4
0.7
0.85
1
x
f ∗,n∗
xi
Grupisae proseqnih o ena studenata je lakxe sprovesti ako se prethodno
napravi varija ioni niz,
(6.74, 6.95, 7.23, 7.23, 7.82, 7.95, 7.95, 8.12, 8.25, 8.25,
8.25, 8.61, 8.75, 8.75, 9.10, 9.10, 9.10, 9.25, 9.39, 9.63).
Intervali po kojima se grupixu proseqne o ene su odreÆeni kriterijumima za
uspexnost studenata. Statistiqka serija intervalno grupisanih podataka je pri-
kazana u tabeli 2.2. Odgovarajui histogrami su prikazani na sli i 2.1.
Napomene: (1) Posledi interval je neprirodno proxiren (proseqna o ena ne
moe biti vea od 10). Razlog je tehniqke prirode, bitno je da svi intervali
budu jednake xirine. (2) Proseqna o ena studenta moe biti i maa od 6.5, pa
je prvi interval (po prirodi obeleja) [5.5, 6.5). MeÆutim, frekven ija ovog in-
tervala je 0, pa se zato ne nalazi u tabeli.
72 POGLAVE 2. STATISTIKA
xi [6.5, 7.5) [7.5, 8.5) [8.5, 9.5) [9.5, 10.5)
fi 4 7 8 1
nxi4 11 19 20
Tabela 2.2: Proseqne o ene studenata, grupisane po intervalima
6 7 8 9 10
1
4
7
8
x
f
6 7 8 9 10
4
11
20
x
nxi
Slika 2.1: Histogram frekven ija i zbirnih frekven ija intervalne statistiqke
serije proseqnih o ena
2.5 Deskriptivna statistika
Kao xto raspodela verovatnoa sluqajne promenive ima svoje numeriqke karak-
teristike, tako je i empirijska raspodela statistiqkog obeleja X okarakteri-
sana numeriqkim pokazateima koji se raqunaju primenom razliqitih statistika
a na odgovarajui naqin opisuju statistiqku seriju.
Numeriqke karakteristike statistiqke serije dobijene primenama statistika
se nazivaju deskriptivne statistiqke mere i imaju dvojaku ulogu:
• opisuju bitne karakteristike posmatrane statistiqke serije, tj. jezgrovitoi jasno opisuju podatke
• omoguavaju poreÆee vixe statistiqkih serija.Deskriptivne statistiqke mere se odreÆuju primenom statistika na realizovani
uzorak, odnostno odgovarajuu statistiqku seriju.
2.5. DESKRIPTIVNA STATISTIKA 73
U nastavku e zasebno biti razmatrane deskriptivne statistiqke mere reali-
zovanog uzorka za diskretno i neprekidno obeleje, odnosno statistiqke serije i
intervalne statistiqke serije.
2.5.1 Deskriptivne statistiqke mere diskretnog obeleja
Neka je X diskretno obeleje koje se analizira na osnovu statistiqke serije
(xi, fi), i = 1, . . . , k, f1 + f2 + . . .+ fk = n.
Ako bi qitavu statistiqku seriju trebalo predstaviti jednim brojem, to bi bila
neka od mera srede vrednosti.
Zajedniqke osobine svih mera srede vrednisti (izraqunatih i pozi ionih)
su:
− nalaze se u varija ionom intervalu, (xmin, xmax)
− ne moraju pripadati skupu realizovanih vrednosti (osim modusa).
Aritmetiqka sredina statistiqke serije je prosek, sreda vrednost re-
alizovanih vrednosti obeleja ponderisanih frekven ijama
xn =1
n
k∑
i=1
xifi. (2.5)
Zbir odstupaa svih vrednosti realizovanog uzorka od aritmetiqke sredine je
jednak nuli,
n∑
i=1
(xi − xn) =k∑
i=1
fi(xi − xn) = 0.
Geometrijska sredina statistiqke serije je podesniji reprezent podataka
kada se u skupu vrednosti mogu uoqiti karakteristike geometrijske progresije.
Definisana je kao
Gn =n
√
xf11 xf2
2 · · ·xfkk , (2.6)
a praktiqno se raquna u dva koraka,
logGn =1
n
k∑
i=1
fi log xi, G = 10logGn.
74 POGLAVE 2. STATISTIKA
Harmonijska sredina statistiqke serije je aritmetiqka sredina re ip-
roqnih vrednosti realizovanog uzorka
Hn =n
k∑
i=1
fixi
(2.7)
i karakteristiqna je po tome xto na u najvixe utiqe minimalna vrednost
uzorka, xmin ≤ Hn ≤ n · xmin.
Poredak ove tri srede vrednosti je konstantan,
xn ≥ Gn ≥ Hn.
Sve tri su veoma osetive na ekstremne vrednosti. Geometrijska sredina se moe
odreÆivati samo za strogo pozitivne podatke, harmonijska sredina se ne moe
odrediti za podatke koji sadre nulu, a za aritmetiqku sredinu nema nikakvih
ograniqea.
Uzoraqki modus mo je vrednost u uzorku koja ima najveu frekven iju.
Moe se desiti da modus ne postoji (ako su sve apsolutne frekven ije meÆusobno
jenake), a moe biti i vixe modusa u jednoj statistiqkoj seriji.
Uzoraqka medijana me je vrednost koja deli varija ioni niz na dva jed-
naka dela. Raquna se po formuli
me =
x(n+12 ), n - neparno
x(n2 )+x(n2 +1)
2, n - parno.
Deskriptivne statistiqke mere koje ukazuju na rasturae statistiqke serije u
odnosu na aritmetiqku sredinu takoÆe se dobijaju primenom odgovarajuih statis-
tika.
Uzoraqka disperzija i korigovana uzoraqka disperzija ukazuju na srede
kvadratno odstupae
s2n =1
n
k∑
i=1
fi(xi − xn)2 =
k∑
i=1
fix2i
n− (xn)
2, s2n =1
n− 1
k∑
i=1
fi(xi − xn)2. (2.8)
Uzoraqko standardno odstupae je sn =√
s2n.
2.5. DESKRIPTIVNA STATISTIKA 75
Srede apsolutno odstupae je
Ad =1
n
k∑
i=1
fi|xi − xn|. (2.9)
Varija ioni raspon je R = xmax − xmin.
Koefi ijent varija ije je jedina relativna mera odstupaa, i moe se
izraqunati samo ako je aritmetiqka sredina razliqita od nule,
v =snxn
· 100%. (2.10)
Omoguava poreÆee razliqitih statistiqkih serija, xto je od naroqitog in-
teresa u sluqaju da se odnose na istu popula iju. Na primer, ako se posmatraju
teine i visine na istoj popula iji udi, onda se poreÆeem koefi ijenata va-
rija ije moe ustanoviti koje od obeleja je ujednaqenije.
Deskriptivne statistiqke mere oblika raspodele su koefi ijent asimetrije
α3 i koefi ijent spoxtenosti α4, na osnovu kojih se raspodela podataka
poredi sa normalnom raspodelom,
α3 =
1n
k∑
i=1
fi(xi − xn)3
s3n, α4 =
1n
k∑
i=1
fi(xi − xn)4
s4n. (2.11)
Vee vrednosti |α3| znaqe veu asimetriju. Ako je koefi ijent asimetrije jednaknuli, onda je raspodela simetriqna u odnosu na pravu x = xn i vai xn = me = mo.
Ako je α3 < 0, raspodela je asimetriqna u levo (negativna asimetrija, empirijska
raspodela je produena u levo) i xn < me < mo. U sluqaju α3 > 0 raspodela je
asimetriqna u desno (pozitivno asimetriqna, empirijska raspodela je produena
u desno) i xn > me > mo. Primeri asimetriqnih empirijskih raspodela su na
levom grafiku slike 2.2.
Koefi ijent spoxtenosti kod standardne normalne raspodele iznosi 3. Spox-
tenost raspodele je vea nego kog normalne, ako je α4 < 3, a raspodela je izduenija
u sluqaju α4 > 3, xto pokazuje i desni grafik na sli i 2.2.
76 POGLAVE 2. STATISTIKA
α3 < 0α3 > 0
x
f ∗(x)
α4 > 3
α4 < 3
x
f ∗(x)
Slika 2.2: Primeri asimetriqnih i razliqito spoxtenih empirijskih raspo-
dela u odnosu na standardnu normalnu raspodelu.
Primer. O ene studenata. Deskriptivne statistiqke mere e biti upotreb-
ene za odreÆivae osnovnih numeriqkih pokazatea proste statistiqke serije iz
primera O ene studenata. Odgovarajua tabela 2.1 se proxiruje sa iem lakxih
izraqunavaa, i generixe se tabela 2.3.
xi fi xifi log xi fi log xifixi
|xn−xi|fi (xn−xi)2fi (xn−xi)
3fi (xn−xi)4fi
6 2 12 0.778 1.556 0.33 3.9 7.605 14.830 28.918
7 6 42 0.845 5.071 0.86 5.7 5.415 5.144 4.887
8 6 48 0.903 5.419 0.75 0.3 0.015 -0.001 0.000
9 3 27 0.954 2.863 0.33 3.15 3.3075 -3.473 3.647
10 3 30 1 3 0.3 6.15 12.6075 -25.845 52.983
20 159 17.909 2.57 19.2 28.95 -9.345 90.435
Tabela 2.3: O ene studenata, proxirena tabela
Na osnovu vrednosti iz poslede vrste, dobijaju se
• izraqunate srede vrednosti:
xn = 7.95, Gn = 7.86, Hn = 7.78,
• mere odstupaa:
Ad = 0.96, s2n = 1.45, sn ≈ 1.20,
• pokazatei oblika raspodele:
α3 =120· (−9.345)
s3n= −0.27, α4 =
120· 90.435s4n
= 2.18,
na osnovu qega se vidi da je empirijska raspodela o ena studenata asimet-
riqna u desno i spoxtena u odnosu na normalnu raspodelu.
2.5. DESKRIPTIVNA STATISTIKA 77
Statistiqka serija ima dva uzoraqka modusa
mo ∈ 7, 8,
a uzoraqka medijana je
me =8 + 8
2= 8.
Relativni pokazate varijabilnosti o ene je
v =1.20
7.95· 100% = 15.1%.
2.5.2 Deskriptivne statistiqke mere neprekidnog
obeleja
Numeriqke karakteristike empirijske raspodele intervalne statistiqke serije
(Ii = [ai−1, ai), fi), i = 1, . . . , k
su odreÆene istim statistikama kao i u sluqaju diskretne statistiqke serije, ali
one nisu primenive na intervale. Zato se, na osnovu (2.4), za svaki interval od-
reÆuje egova sredina. Tako se svaka od fi proizvonih vrednosti iz intervala Ii
aproksimira vrednoxu glavnog predstavnika, odnosno, intervalnoj statistiqkoj
seriji se pridruuje diskretna i sve izraqunate deskriptivne statistiqke mere
se raqunaju primenom formula (2.5)-(2.11).
Modus i medijana intervalne statistiqke serije se raqunaju na spe ifiqan
naqin. Na osnovu apsolutnih frekven ija i zbirnih apsolutnih frekven ija se
odrede modalni i medijalni interval, Is = [as−1, as) i Il = [al−1, al) i ihova
xirina h = as − as−1 = al − al−1. Modalni interval je onaj sa najveom frekven-
ijom, a medijalni interval ima najmau zbirnu apsolutnu frekven iju koja je
vea od polovine obima uzorka. Uzoraqki modus i uzoraqka medijana se raqunaju
na sledei naqin
mo = as−1 + hr1
r1 + r2, me = al−1 + h
n2− nxl−1
fl,
gde su :
r1 = fs − fs−1 - razlika frekven ija modalnog intervala i intervala koji
prethodi modalnom,
r2 = fs − fs+1 - razlika frekven ija modalnog intervala i intervala koji sledi
za modalnim
78 POGLAVE 2. STATISTIKA
nxl−1=
l−1∑
i=1
fi = f1 + f2 + · · ·+ fl−1 - zbirna apsolutna frekven ija intervala koji
prethodi medijalnom.
Primer. Intervalnoj statistiqkoj seriji iz primera Proseqne o ene studenata,
tabela 2.2, se na jednoznaqan naqin pridruuje prosta statistiqka serija, kao
xto se vidi u tabeli 2.4.
i 1 2 3 4
Ii [6.5, 7.5) [7.5, 8.5) [8.5, 9.5) [9.5, 10.5)
xsi 7 8 9 10
fi 4 7 8 1
nxi4 11 19 20
Tabela 2.4: Proseqne o ene, intervalna i prosta statistiqka serija
Na taj naqin su sve qetiri vrednosti iz prvog intervala aproksimirane proseq-
nom o enom 7, i tako dae.
Sve deskriptivne statistiqke mere statistiqke serije (xsi, fi), i = 1, . . . , 4
(osim pozi ionih) se smatraju validnim pokazateima polazne intervalne serije.
Tako su aritmetiqka sredina, disperzija i koefi ijent varija ije
x20 = 8.3, s220 = 0.71, v = 10.12%.
Na osnovu frekven ija se zakuquje da je modalni interval I3, a medijalni je
I2, pa su vrednosti modusa i medijane
mo = 8.5 + 1 · (8− 7)
(8− 7) + (8− 1)= 8.625,
me = 7.5 + 1 · 10− 4
7= 8.36.
2.6 O ene parametara
Statistiqko istraivae obeleja X na zadatoj popula iji, na osnovu sluqajnog
uzorka (X1, X2, . . . , Xn) se praktiqno svodi na odreÆivae raspodele obeleja,
odnosno na sagledavae svih vrednosti koje obeleje moe da uzme, i sa kojim
verovatnoama. Ako je tip raspodele poznat (da li se radi o normalnoj, binomnoj
ili eksponen ijalnoj...), obiqno su nepoznati parametari koji je blie odreÆuju.
2.6. OCENE PARAMETARA 79
Raspodela moe zavisiti od vixe parametara, ali se u nastavku razmatra odre-
Æivae samo jednog, θ. Uvek je mogue formirati ini ijalnu familiju dopus-
tivih raspodela
F (x, θ) | θ ∈ (θmin, θmax).Na primer, poznato je da teina kao obeleje ima normalnu raspodelu, ali za
popula iju slonova i za popula iju mixeva e se razlikovati familije dopus-
tivih raspodela. Vrednosti parametara zavise od popula ije, i primer familije
dopustivih raspodela je N (370, σ) | σ ∈ (0,∞).Na osnovu statistiqkog istraivaa treba izdvojiti jedan odgovarajui ele-
ment iz familije dopustivih raspodela, ili bar suziti interval (θmin, θmax)
xto je vixe mogue. Ovaj postupak se zove o ena parametra i ona moe biti
taqkasta ili intervalna. Postupak se sprovodi (pr)o eivaem vrednosti
parametra, na osnovu neke odgovarajue statistike uzorka
θ = g(X1, X2, . . . , Xn) (2.12)
koja e za realizovani uzorak dati deskriptivnu statistiqku meru θ∗ kojom se
pro euje nepoznati parametar θ.
2.6.1 Taqkaste o ene
Taqkasta o ena parametra se sastoji u odabiru statistike qija e oqekivana vred-
nost biti "bliska" nepoznatom parametru θ. Pre iznije, treba odabrati odgo-
varajuu transforma iju g prostog sluqajnog uzorka (2.12). Ako je (x1, x2, . . . , xn)
realizovani uzorak, onda je taqkasta o ena parametra θ bax dobijena vrednost
odabrane statistike θ za realizovani uzorak, θ∗ = θ(x1, x2, . . . , xn).
Taqkasta o ena parametra zavisi od realizovanog uzorka, i za dobijeni broj se
ne moe razmatrati pre iznost ili taqnost. U opxtem sluqaju, taqkaste o ene
izraqunate za razliqite realizovane uzorke e biti razliqite, i ne postoji kri-
terijum na osnovu kog bi se odabrala jedna kao "najboa". Dakle, kvalitet izraqu-
nate taqkaste o ene se ne moe razmatrati, ali postoje kriterijumi za odabir
taqkaste o ene kao statistike:
• Postojanost (stabilnost) - taqkasta o ena (2.12) je postojana ako vai
limn→∞
P(
|θ − θ| < ε)
= 1, ∀ε > 0.
• Centriranost - taqkasta o ena (2.12) je entrirana ako je eno matema-
tiqko oqekivae jednako nepoznatom parametru
E(θ) = θ.
80 POGLAVE 2. STATISTIKA
O ena je asimptotski entrirana ako
limn→∞
E(θ) = θ.
• Efikasnost - ako su θ1 = g1(X1, X2, . . . , Xn) i θ2 = g2(X1, X2, . . . , Xn) dve
entrirane taqkaste o ene istog parametra, onda je efikasija ona koja ima
mau disperziju, tj. efikasnija je θ1 ako je
D(θ1) < D(θ2).
Metoda momenata je naqin za odreÆivae taqkastih o ena zasnovan na qie-
ni i da je uzoraqka aritmetiqka sredina (2.1) entrirana o ena za matematiqko
oqekivae. Kako je uzoraqka disperzija asimptotski entrirana o ena za dis-
perziju, uvodi se korigovana uzoraqka disperzija,
S2n =
n
n− 1S2
n =1
n− 1
n∑
i=1
(Xi −Xn)2, (2.13)
koja jeste entrirana, odnosno vai E(
S2n
)
= D(X).
Ako raspodela posmatranog obeleja zavisi od parametra θ, onda i momenti,
kao egove numeriqke karakteristike, zavise od θ. Sa druge strane, uzoraqki
momenti za realizovan uzorak (x1, x2, . . . , xn) daju deskriptivne statistiqke mere
(brojeve), pa se izjednaqavaem odgovarajuih momenata dobijaju jednaqine u ko-
jima su nepoznati samo parametri.
Matematiqko oqekivae, kao obiqan moment prvog reda, ekspli itno zavisi
od nepoznatog parametra, E(X) = h(θ), a jednako je realizovanoj uzoraqkoj arit-
metiqkoj sredini. Tako se dobija jedna jednaqina sa nepoznatom veliqinom θ,
h(θ) = Xn.
Rexee ove jednaqine jeste taqkasta o eena vrednost parametra θ.
Trivijalan sluqaj je kada treba o eniti bax matematiqko oqekivae, jer je po
prethodnom, ono jednako uzoraqkoj aritmetiqkoj sredini. Uzoraqka aritmetiqka
sredina jeste entrirana i postojana
5
taqkasta o ena, odnosno
E(X) = Xn.
Direktim izjednaqavaem entralnih momenata drugog reda dobija se taqkasta
o ena disperzije obeleja. Ona je asimptotski entrirana, i koristi se kada je
matematiqko oqekivae poznato,
D(X) = S2
n =1
n
n∑
i=1
(Xi − E(X))2.
5
Napomena: postojanost je posledi a zakona velikih brojeva
2.6. OCENE PARAMETARA 81
Korigovana uzoraqka disperzija kao entrirana taqkasta o ena disperzije se ko-
risti kada matematiqko oqekivae obeleja nije poznato,
D(X) = S2n =
1
n− 1
n∑
i=1
(Xi −Xn)2.
Metoda maksimalne verodostojnosti se takoÆe koristi za taqkastu o enu
nepoznatog parametra θ koji figurixe u verovatnoi p(x, θ) zakona raspodele u
sluqaju diskretnog obeleja, odnosno gustini raspodele ϕ(x, θ) u sluqaju nepre-
kidnog obeleja.
U zavisnosti od toga da li je obeleje diskretno ili neprekidno, formira se
funk ija verodostojnosti
L(x1, x2, . . . , xn, θ) = p(x1, θ) · p(x2, θ) · . . . · p(xn, θ),
odnosno,
L(x1, x2, . . . , xn, θ) = ϕ(x1, θ) · ϕ(x2, θ) · . . . · ϕ(xn, θ).
Parametar θ se odreÆuje onom statistikom koja obezbeÆuje maksimalnu vrednost
funk ije verodostojnosti. Zbog jednostavnijeg raquna, razmatra se maksimum
funk ije lnL 6
. Ako je funk ija verodostojnosti diferen ijabilna, onda je
potreban uslov za maksimum
∂L
∂θ= 0 odnosno
∂ lnL
∂θ= 0.
Primer. Obeleje X je dato zakonom raspodele sa nepoznatim parametrom θ,
X :
(
−1 0 1 2θ5
(1− 4θ5) 2θ
5θ5
)
.
Na osnovu realizovanog uzorka (0, 1, 1, 2, 1, 0,−1,−1, 1, 0, 1,−1, 0, 2, 1, 1) taqkastoo eniti parametar θ
(a) metodom momenata, (b) metodom maksimalne verodostojnosti.
(a) Izraqunavaem, na osnovu raspodele i uzorka se dobijaju matematiqko oqeki-
vae i uzoraqka aritmetiqka sredina
E(X) = −1 · θ5+ 0 ·
(
1− 4θ
5
)
+ 1 · 2θ5
+ 2 · θ5=
3θ
5
x16 =1
16(−3 + 0 + 7 + 4) =
1
2,
,
6
Maksimumi funk ija L i lnL se poklapaju, po tvrÆeu iz Analize.
82 POGLAVE 2. STATISTIKA
a izjednaqavaem teorijskog i uzoraqkog momenta se dobija jednaqina po nepoz-
natom parametru,
3θ
5=
1
2=⇒ θ∗ =
5
6= 0.83.
(b) Realizovanom uzorku odgovara statistiqka serija
(−1, 3), (0, 4), (1, 7), (2, 2),
i na osnovu e se formiraju funk ija verodostojnosti, en logaritam, i odgo-
varajui par ijalni izvod po nepoznatom parametru:
L(x1, . . . , x16; θ) =
(
θ
5
)3
·(
1− 4θ
5
)4
·(
2θ
5
)7
·(
θ
5
)2
lnL(x1, . . . , x16; θ) = 3 · ln θ
5+ 4 · ln 5− 4θ
5+ 7 · ln 2θ
5+ 2 · ln θ
5
= 5 · ln θ
5+ 7 · ln 2θ
5+ 4 · ln 5− 4θ
5
∂ lnL(x1, . . . , x16; θ)
∂θ= 5 · 5
θ
1
5+ 7 · 5
2θ
2
5+ 4 · 5
5− 4θ
−45
=5
θ+
7
θ− 16
5− 4θ
=60− 64θ
θ(5− 4θ).
Maksimalna vrednost se dostie za 60− 64θ = 0, odnosno θ∗ =60
64= 0.94.
Razliqiti realizovani uzor i daju razliqite o eene vrednosti za parametar, i
o tome koja o eena vrednost je "boa" ne moe se raspravati.
Primer. Prilikom istraivaa koliko kilometara graÆani dnevno prepexaqe,
anketirano je 100 udi i dobijeni rezultati su prikazani u prve dve vrste tabele
2.5. Odrediti entrirane o ene matematiqkog oqekivaa i standardnog odstu-
paa dnevnih xeti.
xi 1 2 3 4 5 6 7 8 9
fi 8 11 12 13 18 8 11 9 10 100
xifi 8 22 36 52 90 48 77 72 90 495
x2i fi 8 44 108 208 450 288 539 576 810 3031
Tabela 2.5: Dnevne xete
2.6. OCENE PARAMETARA 83
Centrirane o ene nepoznatih parametara se dobijaju upotrebom uzoraqke arit-
metiqke sredine i kvadratnog korena korigovane uzoraqke disperzije,
E(X)∗ = X100, σ∗ =
√
S2100 =
√
100
99S2
100 =
√
√
√
√
100
99
(
1
100
100∑
i=1
X2i · fi −X
2
100
)
.
Ove statistike za realizovani uzorak daju o eene vrednosti traenih para-
metara,
E(X)∗ =1
100(1 · 8 + . . .+ 9 · 10) = 4.95,
σ∗ =
√
100
99
(
1
100(12 · 8 + . . .+ 92 · 10)− 4.952
)
= 2.42.
2.6.2 Intervalne o ene
Taqkasto o eena vrednost nepoznatog parametra θ∗ odstupa od prave vrednosti θ,
i to odstupae se ne moe izmeriti niti kontrolisati. Intervalna o ena nepoz-
natog parametra je postupak kojim se na osnovu sluqajnog uzorka odreÆuje interval
I(X1, X2, . . . , Xn) koji obuhvata parametar θ sa unapred zadatom verovatnoom.
Neka su θ1 = g1(X1, X2, . . . , Xn) i θ2 = g2(X1, X2, . . . , Xn) dve statistike takve
da θ1 < θ2 i za koje vai
P(
θ1 < θ < θ2
)
= β,
za unapred zadatu verovatnou β, koja je po pravilu vea od 0.9, obiqno se uzima
β = 0.95, ili β = 0.99. Verovatnoa β se naziva nivo poverea ili nivo
pouzdanosti. Za realizovani uzorak statistike θ1 i θ2 daju brojeve θ∗1 i θ∗2 koji
su grani e za interval poverea, I = (θ∗1, θ∗2).
U interesu je da interval poverea bude xto mae xirine i da nivo pouz-
danosti bude xto vei. Ta dva zahteva su opreqna, ali poveae obima uzorka
povono utiqe na oba zahteva.
Grani e intervala poverea su odreÆene uzoraqkim sluqajnim promenivama
i zato nije ispravno rei da stvarna vrednost parametra pripada intervalu po-
verea sa verovatnoom β. Korektna formula ija je: sa verovatnoom β se moe
tvrditi da formirani interval sadri parametar θ. Iz vixe realizovanih uzo-
raka dobie se razliqiti intervali poverea, ali ih β · 100% zaista sadri
pravu vrednost θ. U β · 100% sluqajeva je uzorak "dobar reprezent" popula ije.
Prilikom odabira statistika θ1 i θ2 formira se transforma ija uzorka Z
84 POGLAVE 2. STATISTIKA
koja ne zavisi od parametra θ, a qija je raspodela poznata7. Statistika Z se bira
tako da dogaÆaji θ1 < θ < θ2 i a < Z < b budu ekvivalentni za neke konstante
a i b, xto dae znaqi i P (a < Z < b) = β. OdreÆivaem konstanti a i b i
transforma ijom nejednakosti a < Z < b mogu se dobiti o eene vrednosti za
grani e intervala poverea (θ1, θ2). Ovaj postupak je qesto veoma sloen, i nije ga
uvek mogue realizovati. U nastavku e biti razmatrani samo neki jednostavniji
sluqajevi odreÆivaa intervala poverea.
U svim sluqajevima se intervali poverea odreÆuju na osnovu realizovanog
uzorka (x1, x2, . . . , xn) i egovih deskriptivnih statistiqkih mera.
Interval poverea za napoznati parametar p obeleja sa binomnom
raspodelom B(n, p) je
I =
(
p− a
√
p(1− p)
n− 1, p+ a
√
p(1− p)
n− 1
)
, (2.14)
gde je p = kn, k je broj jedini a u realizovanom uzorku
8
, i a = Φ−1(β2) iz tabli e
za N (0, 1).
Parametar p zapravo ukazuje na zastupenost elemenata u popula iji koji pose-
duju odreÆeno svojstvo (neispavni proizvodi, strani turisti,...). Ako se iz popu-
la ije na sluqajan naqin odabere jedan element, on e sa verovatnoom p pose-
dovati uoqeno svojstvo. Ako se uoqeno svojstvo posmatra kao obeleje X , onda ono
ima Bernulijevu raspodelu i parametar p je zapravo verovatnoa u Bernulijevoj
raspodeli.
Interval poverea za napoznato matematiqko oqekivae obeleja
sa normalnom raspodelom N (m, σ)
1
o
Ako je standardno odstupae poznato interval poverea za m je
I =
(
xn − aσ√n, xn + a
σ√n
)
, (2.15)
gde je a = Φ−1(β2) iz tabli e za N (0, 1).
2
o
Ako je standardno odstupae nepoznato interval poverea za m je
I =
(
xn − asn√n− 1
, xn + asn√n− 1
)
, (2.16)
7
Najqexe su to standardna normalna raspodela N (0, 1), Studentova t-raspodela ili χ2-
raspodela. Ako se razmatraju uzor i dovono velikog obima, onda se raspodela statistike
moe aproksimirati normalnom raspodelom
8
za svaki odabrani element se u realizovani uzorak upisuje 1 ili 0, zavisno od toga da li on
poseduje ili ne uoqeno svojstvo
2.6. OCENE PARAMETARA 85
gde je sn uzoraqko standardno odstupae. Za dovono velik obim uzorka
(n ≥ 30) je a = Φ−1(β2) iz tabli e za N (0, 1), a inaqe (n < 30) je a = t
n−1, 1+β
2
iz tabli e Studentove t-raspodele.
Interval poverea za napoznatu disperziju obeleja sa normalnom
raspodelom N (m, σ)
Kako disperzija ne moe biti negativna, doa grani a intervala poverea moe
unapred biti postavena, 0. Takav interval poverea je jednostrani, ali se moe
formirati i dvostrani,
I =
(
0,ns2nc
)
, I =
(
ns2na
,ns2nb
)
, (2.17)
gde su c = χ2n−1,β, a = χ2
n−1, 1+β
2
i b = χ2n−1, 1−β
2
vrednosti dobijene iz tabli e
χ2-raspodele.
Primer. Koxarkax je u 100 slobodnih ba aa postigao 60 poena. Odrediti 95%
interval poverea za verovatnou pogotka u pojedinaqnom slobodnom ba au.
Na osnovu n = 100 realizovanih slobodnih ba aa i broja postignutih koxeva
je p = 60100
= 0.6. Za dati nivo poverea je inverzna vrednost Laplasove funk ije
a = Φ−1(0.475) = 1.96, i primenom (2.14) se dobija traeni interval poverea
I =
(
0.6− 1.96
√
0.6 · 0.499
, 0.6 + 1.96
√
0.6 · 0.499
)
= (0.504, 0.696) .
Zakuqak je da se sa nivoom poverea 95% moe tvrditi da je verovatnoa pogotka
u pojedinaqnom slobodnom ba au izmeÆu 50.4% i 69.6%.
Primer. Teina jabuka prve klase ima normalnu raspodelu sa standardnim
odstupaem 30g. Odrediti 99% interval poverea za proseqnu teinu jabuke
prve klase, na osnovu realizovanog uzorka obima 100 qija je aritmetiqka sredina
180g.
Poznati poda i su σ = 30g, n = 100 i x100 = 180g, i primenom (2.15) se dobija
traeni interval poverea
I =(
180− Φ−1(
0.992
)
· 3010, 180 + Φ−1
(
0.992
)
· 3010
)
= (180− 2.575 · 3, 180 + 2.575 · 3)= (172.3, 187.7).
Sa verovatnoom 0.99 se moe tvrditi da je proseqna teina jabuka prve klase
izmeÆu 172.3 i 187.7 grama.
86 POGLAVE 2. STATISTIKA
Primer. Poznato je da su teine ivih bia opisane normalnom raspodelom.
Na osnovu izmerenih teina devet plavih kitova: 23t, 27t, 23.5t, 25t, 26.5t, 24t,
25.5t, 24.5t i 26t, odrediti 95% i 98% interval poverea za oqekivanu vrednost
teine plavih kitova.
Realizovani uzorak je malog obima n = 9, i egova aritmetiqka sredina, dis-
perzija i standardno odstupae su:
x9 =1
9(23 + 27 + 23.5 + 25 + 26.5 + 24 + 25.5 + 24.5 + 26) = 25
s29 =1
9
(
22 + 22 + 1.52 + 02 + 1.52 + 12 + 0.52 + 0.52 + 12)
= 1.67
s9 =√1.67 = 1.29
Traeni intervali se odreÆuju primenom (2.16), a iz tabele 3.2 se oqitavaju vred-
nosti t8,0.975 = 2.306 i t8,0.99 = 2.896. Sledi:
I95 =(
25− 2.306 · 1.29√8, 25 + 2.306 · 1.29√
8
)
= (23.95, 26.05)
I98 =(
25− 2.896 · 1.29√8, 25 + 2.896 · 1.29√
8
)
= (23.68, 26.32).
Napomena. Kada disperzija obeleja nije poznata, xirina intervala poverea
zavisi od realizovanog uzorka.
Primer. Iz popula ije qije obeleje ima normalnu raspodelu na sluqajan naqin
je izvuqen uzorak obima 27 i dobijena je odgovarajua uzoraqka disperzija s227 =
5.2. Odrediti dvostrani i jednostrani interval poverea disperzije obeleja
na eloj popula iji za nivo poverea 95%.
U tabli ama 3.3-3.4 se pronalaze vrednosti
a = χ226, 1+β
2
= χ226,0.975 = 41.9, b = χ2
26, 1−β2
= χ226,0.025 = 13.8,
c = χ226,β = χ2
26,0.95 = 38.9,
i primenom (2.17) se dobijaju traeni intervali,
I =
(
27 · 5.241.9
,27 · 5.213.8
)
= (3.35, 10.17), I =
(
0,27 · 5.238.9
)
= (0, 3.61).
2.7 Testirae statistiqkih hipoteza
U okviru statistiqkog istraivaa se mogu na osnovu posmatraa ili prethod-
nih saznaa o pojavi, postaviti neke pretpostavke o posmatranom obeleju. Na
primer, o tipu raspodele, o sredoj vrednosti obeleja, o vrednosti parametra
2.7. TESTIRAE STATISTIQKIH HIPOTEZA 87
raspodele poznatog tipa, o jednakosti parametara dve raspodele, o jednakosti ras-
podela dva razliqita obeleja... Ci statistiqkog istraivaa je da se pret-
postavka proveri.
Matematiqki pre izno, pretpostavka o obeleju se naziva statistiqka hipo-
teza a postupak verifika ije je statistiqko testirae i sprovodi se analizom
uzorka. Funk ija uzorka (statistika) koja se koristi u pro esu verifika ije se
naziva test statistika Z. Statistiqko testirae se zavrxava donoxeem od-
luke o hipotezi, da li se ona potvrÆuje ili odba uje. Zakuqak se donosi na osnovu
realizovanog uzorka, odnosno egove deskriptivne statistiqke mere dobijene pri-
menom odabrane test statistike. Zakuqivae o popula iji na osnovu uzorka ne
moe da bude apsolutno taqno/pouzdano, pa se i odluka o (ne)odba ivau hipoteze
donosi sa odreÆenim stepenom nesigurnosti, koji se opet, moe kontrolisati.
Unapred se zadaje prag znaqajnosti α koji predstava najveu dozvoenu vero-
vatnou da se odba i hipoteza koja jeste taqna. Ovako kon ipirani testovi se
nazivaju testovi znaqajnosti.
Prilikom razmatraa pretpostavki o obeleju potrebno je hipotezu for-
mulisati pre izno i u obliku koji je pogodan za verifika iju. Naime, problem
se obiqno moe iskazati u vidu dva suprotstavena tvrÆea:
· Nulta hipoteza, H0 - je primarna hipoteza, sadri konkretnu pretpostavku
koju treba verifikovati;
· Alternativna hipoteza, H1 - suprotstavena je nultoj, ali ne mora da sadri
punu nega iju tvrÆea nulte hipoteze.
Priroda tvrÆea sadranog u hipotezi odreÆije i tip statistiqkog testa:
• Parametarske hipoteze - preduslov za ovu vrstu hipoteza je poznavae fa-milije dopustivih raspodela, a hipoteza se onda odnosi na vrednost nepoz-
natog parametra, H0(θ = θ0); proveravaju se parametarskim testovima zna-
qajnosti. Zavisno od tipa alternativne hipoteze, H1(θ 6= θ0), H1(θ < θ0) ili
H1(θ > θ0), parametararski testovi znaqajnosti mogu biti dvostrani ili
jednostrani.
• Neparametarske hipoteze - sadre tvrdu o obliku raspodele, pretpostavase da raspodela obeleja ima konkretan oblik, na primer H0(X : N (7, 2));
proveravaju se primenom neparametarskih testova.
Nulta i alternativna hipoteza nisu ravnopravne u statistiqkom istraivau.
U statistiqkom testirau se nulta hipoteza smatra validnom, aktuelnom, vaeom,
i postupkom testiraa se utvrÆuju argumenti, razlozi, dokazi za eno eventualno
odba ivae, a u korist alternativne hipoteze. Na osnovu realizovanog uzorka se
utvrÆuje da li je razlika izmeÆu nulte hipoteze i stvarnih qieni a sluqajna
88 POGLAVE 2. STATISTIKA
(pa se ne odba uje H0) ili je statistiqki znaqajna (pa se odba uje H0).
Svako statistiqko testirae sa zavrxava donoxeem zakuqka:
· H0 se ne odba uje - nije pravilno rei (mada je uobiqajeno) da se H0 prihvata,
ili da je potvrÆena;
· H0 se odba uje u korist alternativne hipoteze H1 - ovo nikako ne znaqi da
je H1 potvrÆena (to nije razmatrano u okviru testiraa).
Osnovni zadatak teorije statistiqkog testiraa jeste odreÆivae kriteri-
juma/pravila po kome se nulta hipoteza odba uje ili ne. Odluka nakon parame-
tarskog testa moe biti doneta na dva naqina:
• izraqunavaem p-vrednosti9
Neka θ∗ oznaqava vrednost parametra dobijenu na osnovu realizovanog uzorka,
i neka je α∗verovatnoa dogaÆaja da se stvarna vrednost parametra θ raz-
likuje od pretpostavene θ0 vixe nego izraqunata,
P (|θ − θ0| > |θ∗ − θ0|) = α∗. (2.18)
Ova izraqunata verovatnoa se poredi sa pragom znaqajnosti:
Ako je α∗ ≤ α smatra se da postoje empirijski dokazi protiv nulte hipoteze
i ona se odba uje u korist alternativne.
Ako je α∗ > α realizovani uzorak ne protivreqi nultoj hipotezi i nema
dovono dokaza za odba ivae H0.
• odreÆivaem kritiqne oblasti Cα
koja odgovara dogaÆaju "stvarna vrednost parametra se znaqajno razlikuje od
pretpostavene", a qija je verovarnoa unapred poznata i jednaka je pragu
znaqajnosti,
P (|θ − θ0| > ε) = α. (2.19)
Kritiqna oblast Cα je "dovono daleko od pretpostavene vrednosti para-
metra" i sa (malom) verovatnoom α sadri stvarnu vrednost parametra.
OdreÆena je kritiqnom vrednoxu cα i obiqno je oblika Cα = (−∞,−cα) ∪(cα,∞). Suprotni dogaÆaj daje interval I(1−α) koji sa verovatnoom 1−α = β
obuhvata stvarnu vrednost parametra. Na osnovu realizovanog uzorka se do-
bija izraqunata vrednost parametra θ∗ i donosi se zakuqak testa:
Ako θ∗ /∈ Cα, onda θ∗ ∈ I(1−α) i nulta hipoteza se ne odba uje.
Ako θ∗ ∈ Cα onda se nulta hipoteza odba uje.
Verovatnoe dogaÆaja (2.18) i (2.19) se ne mogu direktno odrediti. Traena
p-vrednost α∗je od interesa u prvom sluqaju, a veliqina ε definixe kritiqnu
oblast Cα. Obe vrednosti se dobijaju razmatraem ekvivalentnih dogaÆaja (koji
9p-vrednost je izraqunata verovatnoa
2.7. TESTIRAE STATISTIQKIH HIPOTEZA 89
imaju istu verovatnou) a koji podrazumevaju upotrebu pogodno odabrane test
statistike Z.
Prilikom testiraa hipoteza mogu se napraviti dve vrste grexaka:
1
o
Grexka prve vrste - nastaje u sluqaju kada se odba i taqna nulta hipo-
teza, proglasi se netaqnim nexto xto jeste taqno; kontrolixe se pragom
znaqajnosti α.
2
o
Grexka druge vrste - nastaje kada se ne odba i pogrexna nulta hipoteza,
kada neistina nije opovrgnuta; ova grexka obiqno nastaje zbog malog uzorka
i u opxtem sluqaju je nepoznata.
Rizi i pravea grexaka prve i druge vrste su obrnuto propor ionalni. Va-
nije je ne napraviti grexku prve vrste jer se time odba ije qieni a u korist
neqega xto nije taqno.
Testirae statistiqkih hipoteza je ponekad veoma sloen postupak, pre svega
zbog texkoa u odabiru test statistike qija e raspodela biti poznata. Slede
primeri jednostavnijih statistiqkih testova. Postupak statistiqkog testiraa,
u svim sluqajevima, podrazumeva sledee faze:
1
o
formulisae hipoteza H0 i H1,
2
o
utvrÆivae praga znaqajnosti α,
3
o
odreÆivae obima uzorka n,
4
o
odabir test statistike Z,
5
o
formirae kritiqne oblasti Cα na osnovu izraqunate kritiqne vrednosti
cα,
6
o
izraqunavae vrednosti test statistike z∗ za realizovani uzorak,
7
o
donoxee zakuqka statistiqkog testa - odluqivae na osnovu prethodna
dva koraka.
Testirae hipoteza o sredoj vrednosti
Ako posmatrano obeleje ima normalnu raspodelu X : N (m, σ), onda i uzoraqka
aritmetiqka sredina ima takoÆe normalnu raspodelu, Xn : N (m, σ/√n). Stan-
dardiza ija daje pogodnu test statistiku,
Z =Xn −m0
σ
√n, (2.20)
gde je m0 pretpostavena vrednost matematiqkog oqekivaa m, odnosno nulta hi-
poteza je H0(m = m0). Ako je nulta hipoteza taqna, onda odabrana test statistika
ima normalnu raspodelu N (0, 1).
90 POGLAVE 2. STATISTIKA
Kritiqna oblast se formira u zavisnosti od zadatog praga znaqajnosti i tipa
alternativne hipoteze:
• H1(m 6= m0)
Razlika stvarne vrednosti parametra od pretpostavene jeste znaqajna ako
za ε > 0 iz (2.19) vai
∣
∣Xn −m0
∣
∣ > ε ⇔∣
∣
∣
∣
Xn −m0
σ
√n
∣
∣
∣
∣
>ε√n
σ⇔ |Z| > cα.
Zbog meÆusobne ekvivalentnosti dogaÆaja, mora da vai P (|Z| > cα) = α, pa
se kritiqna vrednost odreÆuje iz tabele 3.1,
cα = Φ−1
(
1− α
2
)
,
a kritiqna oblast je Cα = (−∞,−cα) ∪ (cα,∞). Kako je kritiqna oblast
unija dva intervala, za ovaj test se kae da je dvostrani.
• H1(m > m0)
DogaÆaj od interesa je sada
Xn −m0 > ε ⇔ Xn −m0
σ
√n >
ε√n
σ⇔ Z > cα.
Kritiqna oblast je Cα = (cα,∞), a kritiqna vrednost se odreÆuje iz uslova
P (Z > cα) = α,
cα = Φ−1
(
1
2− α
)
.
Ovo je primer jednostranog testa.
• H1(m < m0)
DogaÆaj od interesa je sada
m0 −Xn > ε ⇔ Xn −m0√n
σ < − εσ√n⇔ Z < −cα.
Kritiqna oblast je jednostrana Cα = (−∞,−cα), a kritiqna vrednost se
odreÆuje isto kao u prethodnom sluqaju. Za test se takoÆe kae da je jednos-
tran.
Ako je (x1, x2, . . . , xn) realizovani uzorak na osnovu kog se testira hipoteza, onda
se za test statistiku (2.20) raquna realizovana vrednost
z∗ =xn −m0
σ
√n,
i na osnovu ene pripadnosti kritiqnoj oblasti se nulta hipoteza odba uje ili
ne.
2.7. TESTIRAE STATISTIQKIH HIPOTEZA 91
U sluqaju da standardna devija ija σ posmatranog obeleja nije poznata ko-
risti se test statistika
Z =Xn −m0
Sn
√n− 1, (2.21)
koja ima Studentovu t-raspodelu sa n−1 stepeni slobode, a za uzorke velikog obiman ≥ 30 se aproksimira standardnom normalnom raspodelom. Zavisno od formu-
la ije alternativne hipoteze statistiqki test je dvostrani ili jednostrani, a
kritiqne oblasti i kritiqne vrednosti su date u tabeli
H1 Cα cα, zavisno od n
m 6= mo (−∞,−cα) ∪ (cα,∞) Φ−1(1−α2), tn−1;1−α
2
m > mo (cα,∞) Φ−1(12− α), tn−1;1−α
m < mo (−∞,−cα) Φ−1(12− α), tn−1;1−α
Ako se testirae vrxi na osnovu realizovanog uzorka (x1, x2, . . . , xn) onda se
raquna realizovana vrednost test statistike (2.21)
z∗ =xn −m0
sn
√n− 1
i donosi se odluka zavisno od toga da li z∗ pripada kritiqnoj oblasti ili ne.
Testirae hipoteze o zastupenosti/pro entu/verovatnoi
U fokusu statistiqkog istraivaa je obeleje X koje se opisuje Bernulijevom
raspodelom sa nepoznatim parametrom p, 0 < p < 1. Neka je broj jedini a u uzorku
(X1, X2, . . . , Xn) oznaqen sa K. Moe se pokazati da K ima Binomnu raspodelu
B(n, p). Prilikom testiraa hipoteze o vrednosti parametra p, H0(p = p0), ko-
risti se test statistika
Z =Kn− p0
√
p0(1−p0)n
, (2.22)
koja za dovono veliko n i p0 koje nije blisko niti 0 niti 1, ima standardnu nor-
malnu raspodelu N (0, 1). Zavisno od praga znaqajnosti i alternativne hipoteze,
formira se kritiqna oblast Cα na isti naqin kao kod testa srede vrednosti za
poznatu disperziju. U realizovanom uzorku (x1, x2, . . . , xn) broj jedini a k daje
relativnu frekven iju
kn, i dae, realizovanu vrednost test statistike (2.22),
z∗ =kn− p0
√
p0(1−p0)n
,
i na osnovu ene pripadnosti kritiqnoj oblasti se nulta hipoteza odba uje ili
ne.
92 POGLAVE 2. STATISTIKA
Testirae neparametarske hipoteze
Hipoteza je neparametarska ako se odnosi na raspodelu verovatnoa posmatranog
obeleja X na popula iji. Nulta hipoteza H0(F = F0) sadri pretpostavku o
konkretnoj, teorijskoj funk iji raspodele (F0) koja opisuje raspodelu obelejaX .
Ispituje se ena usaglaxenost sa empirijskom funk ijom raspodele realizovanog
uzorka. Za alternativnu hipotezu se uzima H1(F 6= F0), a prag znaqajnosti testa
je α.
Pirsonov χ2-test je jedan od naqina za verifika iju neparametarskih hipo-
teza, koji je primeniv za sluqajne promenive i diskretnog i neprekidnog tipa,
ako je mogue obezbediti uzorak obima bar n = 50. Formira se test statistika
koja izraava odstupae empirijske od teorijske funk ije raspodele, a koja ima
χ2-raspodelu, pa se prilikom testiraa koriste tabele 3.3 i 3.4. Ini ijalno se
skup realnih brojeva razbija na k intervala, Im = (am−1, am] , m = 1, . . . , k, tako
da u svakom bude bar 5 elemenata realizovanog uzorka, a fm oznaqava apsolutnu
empirijsku frekven iju. Teorijska verovatnoa pripadaa obeleja X pojedi-
nom intervalu je pm = F0(am)− F0(am−1), pa je apsolutna teorijska frekven ija
svakog intervala npm. Za realizovani uzorak se raquna vrednost
z∗ =
m=k∑
m=1
(fm − npm)2
npm, (2.23)
a odgovarajua test statistika Z ima χ2-raspodelu sa k − 1 − s stepeni slobode,
gde je k broj intervala, a s je broj nepoznatih parametara teorijske raspodele koji
se o euju na osnovu realizovanog uzorka.
Kritiqna oblast Pirsonovog χ2-testa je jednostrana Cα = (cα,∞), gde je kri-
tiqna vrednost cα = χ2k−1−s;1−α. Nulta hipoteza se odba uje ako je realizovana
vrednost test statistike u kritiqnoj oblasti z∗ ∈ Cα, u protivnom se ne odba uje.
Ako se testira hipoteza o raspodeli diskretnog obeleja, onda se u svakom
intervalu nalazi najqexe po jedna vrednost xm koju obeleje moe da uzme, pa
vai pm = p(X = xm).
Primer. Propisana teina vekne hleba je 500g. U pekari A je analiziran uzorak
obima 10 i konstatovana je sreda vrednost 530g i standardno odstupae 30g. U
pekari K je analiziran uzorak obima 50 i dobijena je sreda vrednost 520g i
standardno odstupae 45g. Sa pragom znaqajnosti 0.01 testirati hipotezu da su
vekne hleba propisane teine u svakoj od pekara.
Treba testirati hipoteze o sredoj vrednosti kad disperzija obeleja nije
poznata. Za obe pekare je H0(m = 500) i H1(m 6= 500), i koristi se test statistika
2.7. TESTIRAE STATISTIQKIH HIPOTEZA 93
(2.21). Kritiqna oblast je u oba sluqaja dvostrana. Za pekaru A statistika Z ima
Studentovu t-raspodelu sa 9 stepeni slobode, a za pekaru K ima standardizovanu
normalnu raspodelu.
A) n = 10, x10 = 530, s10 = 30, na osnovu qega je
z∗ =530− 500
30
√10− 1 = 3, c0.01 = t9;1− 0.01
2= t9;0.995 = 3.25.
Kako z∗ /∈ C0.01 = (−∞,−3.25) ∪ (3.25,∞), nulta hipoteza se ne odba uje.
K) n = 50, x10 = 520, s10 = 45, na osnovu qega je
z∗ =520− 500
45
√49 = 3.11,
c0.01 = Φ−1
(
1
2− 0.01
2
)
= Φ−1 (0.495) =2.57 + 2.58
2= 2.575.
Kako z∗ ∈ C0.01 = (−∞,−2.575) ∪ (2.575,∞), nulta hipoteza se odba uje.
Zakuqak statistiqkog testa: sa rizikom od 1% se moe tvrditi da su vekne
hleba u pekari A propisane teine, a u pekari K nisu.
Primer. U uzorku od 200 analiziranih proizvoda nalazi se 11 neispravnih
proizvoda. Sa pragom znaqajnosti α = 0.05 proveriti tvrdu proizvoÆaqa da
pro enat neispravnih proizvoda nije vei od 7%.
UtvrÆuje se zastupenost (verovatnoa pojavivaa) neispravnih proizvoda,
p. Nultoj hipotezi H0(p = 0.07) se suprotstava alternativna H1(p > 0.07), jer
je dogaÆaj p < 0.07 povoan, bax kao i tvrÆee nulte hipoteze. Statistiqki
test je jednostran i kritiqna oblast je C0.05 = (c0.05,∞) pri qemu se koristi test
statistika (2.22),
z∗ =11200− 0.07
√
0.07·0.93200
= −0.83, c0.05 = Φ−1
(
1
2− 0.05
)
= 2.575.
Kako realizovana vrednost test statistike ne pripada kritiqnoj oblasti, nulta
hipoteza se ne odba uje. Sa rizikom od 5% se moe prihvatiti tvrda proizvo-
Æaqa.
Primer. Tokom 100 dana je praen broj pristiglih liqnih elektronskih poruka.
Raspodela broja dana po broju pristiglih poruka je data u tabeli.
broj pristiglih poruka 0 1 2 3 4 5 6 7
fm 6 12 20 25 18 10 6 3
Sa pragom znaqajnosti α = 0.05 proveriti da li se raspodela pristiglih poruka
moe opisati Poasonovom raspodelom.
94 POGLAVE 2. STATISTIKA
Prvo treba primetiti da parametar λ Poasonove raspodele nije pretpostaven
(tako da je s = 1), nego ga treba o eniti na osnovu realizovanog uzorka. Kako je i
matematiqko oqekivae Poasovove sluqajne promenive bax λ, metodom momenata
parametar moe biti o een na osnovu uzoraqke aritmetiqke sredine,
λ =1
100(6 · 0 + 12 · 1 + 20 · 2 + 25 · 3 + 18 · 4 + 10 · 5 + 6 · 6 + 3 · 7) = 3.
Posleda frekven ija je maa od 5 pa se poslede dve klase objediuju. Raqunaju
se teorijske apsolutne frekven ije, primenom (1.23),
p1 = p(0) = 30
0!e−3 = 0.0498, p2 = p(1) = 31
1!e−3 = 0.1494,
p3 = p(2) = 32
2!e−3 = 0.2240, p4 = p(3) = 33
3!e−3 = 0.2240,
p5 = p(4) = 34
4!e−3 = 0.1680, p6 = p(5) = 35
5!e−3 = 0.1008
p7 = p(6) + p(7) + . . . = 0.084.
Formira se tabela
xm 0 1 2 3 4 5 6,7...
fm 6 12 20 25 18 10 6 + 3
100pm 4.98 14.94 22.4 22.4 16.8 10.08 8.4(fm−100pm)2
100pm0.209 0.579 0.257 0.302 0.086 0.001 0.043
Sumiraem vrednosti iz poslede vrste, na osnovu (2.23), dobija se da je reali-
zovana vrednost test statistike z∗ = 1.477.
Na osnovu vrednosti iz tabele 3.4 je kritiqna vrednost cα = χ25;0.95 = 11.1. Kako je
z∗ van kritiqne oblasti C0.05 = (11.1,∞), nema razloga da se odba i nulta hipo-
teza. Zakuqak je da se empirijska raspodela ne razlikuje znaqajno od Poasonove
raspodele P(3).
2.8 Regresiona analiza
Regresiona analiza je skup statistiqkih tehnika kojima se prouqava povezanost
razliqitih obeleja posmatranih na istoj popula iji. Ci je sagledati da li su
dva obeleja meÆusobno povezana, koja je vrsta i jaqina te povezanosti.
Na primer, u popula iji automobila se mogu posmatrati obeleja X - preÆeni
kilometri, Y - snaga motora, Z - potroxa goriva, U - boja automobila... Jasno
je da su obeleja Y i Z jako povezana, kao i X i Z, dok obeleja X i Y , odnosno
Z i U nisu uopxte povezani.
Zavisnost meÆu posmatranim obelejima X i Y na istoj popula iji je uza-
jamna, i prisutna je ukoliko se moe uoqiti i matematiqki modelovati zakoni-
tost promena vrednosti tih obeleja. Kao i ostala statistiqka istraivaa i
2.8. REGRESIONA ANALIZA 95
(a) (b)
( ) (d)
Slika 2.3: Razliqite vrste dijagrama rasipaa
regresiona analiza je bazirana na analizi sluqajnog uzorka. U fokusu je dvodi-
menzionalni sluqajni uzorak
((X1, Y1), (X2, Y2), . . . , (Xn, Yn)) ,
pri qemu se podrazumeva da n dvodimenzionalnih sluqajnih promenivih (Xi, Yi),
i = 1, . . . , n ima istu raspodelu kao i dvodimenzionalno obeleje (X, Y ) . Re-
gistrovana povezanost meÆu obelejima u uzorku predstava o enu povezanosti
tih obeleja u popula iji, i (kao i svaka druga statistiqka o ena) zavisi od
realizovanog uzorka ((x1, y1), (x2, y2), . . . , (xn, yn)). Vrednosti realizovanog uzorka
je pogodno prikazati taqkama u pravouglom koordinatnom sistemu gde svaka od
osa predstava po jedno obeleje. Ovaj grafiqki prikaz se naziva dijagram
rasipaa i razliqiti primeri se mogu videti na sli i 2.3.
Postojae linearne povezanosti se iskazuje korela ijom izmeÆu obeleja X
i Y , koja ukazuje na jaqinu i smer povezanosti (da li su obeleja direktno ili
obrnuto srazmerna). Ako linearna povezanost postoji, onda linearna regre-
96 POGLAVE 2. STATISTIKA
sija odreÆuje matematiqku funk iju koja je najboe opisuje. Regresiona prava
se postava tako da "xto boe" okupi oko sebe sve taqke na dijagramu rasipaa.
Parametri regresione prave (koefi ijent prav a i odseqak na vertikalnoj osi)
se odreÆuju metodom najmaih kvadrata.
Ako zavisnost meÆu obelejima postoji, ali nije linearna (na sli i 2.3b je
prikazan primer paraboliqne zavisnosti), onda se metodama nelinearne regre-
sije odreÆuju krive koje najboe modeluju dati skup taqaka na dijagramu rasi-
paa. Najqexi primeri su paraboliqna, eksponen ijalna i logaritamska zavis-
nost.
2.8.1 Uzoraqka korela ija i regresija
Postoji potpuna analogija izmeÆu dvodimenzionalnog obeleja (X, Y ) i dvodi-
menzionalnih sluqajnih promenivih prikazanih u 1.4.4.
Mera zavisnosti obeleja X i Y je iskazana koefi ijentom korela ije (1.21)
i o euje se statistikom koja se naziva uzoraqka korela ija
R =
1n
n∑
i=1
XiYi −XnY n
SXSY
, (2.24)
gde su Xn i Y n uzoraqke aritmetiqke sredine, i SX i SY uzoraqka standardna
odstupaa. Deskriptivna statistiqka mera realizovanog uzorka
((x1, y1), (x2, y2), . . . , (xn, yn))
dobijena ovom statistikom je realizovana vrednost koefi ijenta korela ije i
oznaqava se sa r,
r =
1n
n∑
i=1
xiyi − xnyn
sxsy.
Ako je |r| = 1 onda su obeleja linearno povezana i svakoj vrednosti jednog
obeleja odgovara taqno jedna vrednost drugog. Koefi ijent prav a linearne
funk ije je istog znaka kao i koefi ijent korela ije, xto ukazuje na direktnu
ili obrnutu srazmeru meÆu obelejima.
Mali koefi ijent korela ije, |r| < 0.3, pokazuje odsustvo korelativne veze, pa
se regresioni model obiqno ne pravi.
Ako su X i Y znaqajno korelisane, |r| ∈ (0.3, 1), a nisu linearno povezane,
moe se odrediti linearna regresija, odnosno regresiona prava koja na najboi
2.8. REGRESIONA ANALIZA 97
naqin aproksimira skup taqaka u ravni (xi, yi), i = 1, . . . , n odreÆenih realizo-
vanim uzorkom. Regresiona prava Y = aX + b (i analogno X = f(Y )) se odreÆuje
metodom najmaih kvadrata, odnosno tako da suma
F (a, b) =
n∑
i=1
(axi + b− yi)2
bude minimalna. Parametri a i b blie odreÆuju linearnu regresiju i dobijaju
se rexavaem sistema linearnih jednaqina
∂F
∂a= 0,
∂F
∂b= 0.
Zavisnosti obeleja Y od X je opisana jednaqinom
Y = yn + r · sYsX
(X − xn) ,
i analogno zavisnosti obeleja X od Y je
X = xn + r · sXsY
(Y − yn) .
Za realizovani uzorak, regresiona prava zavisnosti obeleja Y od X se moe
zapisati u obliku
y = ax+ b, gde su a =sXY
s2X=
sXY
sXsY· sYsX
= rsYsX
, b = yn − axn, (2.25)
a odgovarajua uzoraqka standardna odstupaa se dobijaju na osnovu realizovanog
uzorka,
sXY =1
n
n∑
i=1
xiyi − xnyn, sX =
√
√
√
√
1
n
n∑
i=1
x2i − (xn)2, sY =
√
√
√
√
1
n
n∑
i=1
y2i − (yn)2.
Regresiona prava ima vanu ulogu u predviÆau. Interpola ija je predvi-
Æae vrednosti obeleja Y koje odgovara X = x, za neko x ∈ (xmin, xmax), ali koje
nije u realizovanom uzorku. Ekstrapola ija je predviÆae vrednosti obeleja
Y koje odgovara X = x, za neko x /∈ (xmin, xmax) van opsega realizovanog uzorka.
Primer. Zavisnost meseqne potroxe ua od broja qlanova domainstva. Po-
da i koji se odnose na 10 sluqajno odabranih domainstava se nalaze u tabeli.
Obeleje x predstava broj qlanova domainstva, a y je meseqna potroxa ua
izraena u litrama (l). Poda i su prikazani u tabeli.
x 2 4 3 6 7 2 3 3 3 4
y 1 3 1 4 4 1 2 2 2 3
98 POGLAVE 2. STATISTIKA
Prikazati dijagram rasipaa, odrediti uzoraqku korela iju, a potom i linearnu
regresiju. Predvideti potroxu ua u petoqlanom i u devetoqlanom domainstvu.
Dijagram rasipaa je prikazan rnim taqkama na sli i 2.4.
1 2 3 4 5 6 7 8 9 10
1
2
3
4
5
6
X
Y
Slika 2.4: Zavisnost meseqne potroxe ua od broja qlanova u domainstvu
Tabela sa poda ima se moe proxiriti radi lakxeg izraqunavaa koefi-
ijenta korela ije, i dae, parametara linearne regresije. Posleda kolona
sadri odgovarajue sume.
x 2 4 3 6 7 2 3 4 3 4 38
y 1 3 1 4 4 1 2 2 2 3 23
x24 16 9 36 49 4 9 16 9 16 168
y2 1 9 1 16 16 1 4 4 4 9 65
xy 2 12 3 24 28 2 6 8 6 12 103
Primenom (2.24) se dobija uzoraqka korela ija
r =10.3− 3.8 · 2.3√
16.8− 3.82√6.5− 2.32
= 0.923158,
i ona ukazuje na postojae jake pozitivne zavisnosti. Dae se na osnovu (2.25)
odreÆuju parametri regresione prave,
a =10.3− 3.8 · 2.316.8− 3.82
= 0.66, b = 2.3− 0.66 · 3.8 = −0.21,
koja je opisana jednaqinom y = 0.66·x−0.21, a na sli i 2.4 je prikazana utom bo-jom. Pro ena potroxe u petoqlanom domainstvu podrazumeva interpola iju u
x = 5, i primenom jednaqine regresione prave se dobija y(5) = 0.66·5−0.21 = 3.09,
2.9. VREMENSKE SERIJE 99
xto je na sli i 2.4 prikazano plavom taqkom.
Analogno, ekstrapola ija u x = 9 predviÆa potroxu u devetoqlanom domainstvu,
y(9) = 0.66 · 9− 0.21 = 5.73, xto je na istoj sli i prikazano rvenom taqkom.
2.9 Vremenske serije
Vremenska serija je skup informa ija o vrednostima neke pojave tokom vremena.
Analiza vremenske serije omoguava razumevae unutraxe strukture podataka i
matematiqko modelovae pojave u funk iji vremena, xto obezbeÆuje predviÆaa
i nadzor pojave u narednom periodu. Kako dinamiqnost ukazuje na promenivost
tokom vremena, analiza vremenske serije se jox naziva i dinamiqka statis-
tiqka analiza.
Vremenske serije su veoma zastupene u svakodnevnom ivotu. Meteoroloxke
serije prate temperaturne promene, koliqine padavina, visinu snenog pokri-
vaqa,... Ekonomske vremenske serije prikazuju godixi nivo proizvode, meseqnu
prodaju nekog artikla, dnevne promene deviznog kursa, meseqne rashode porodi e,...
U pooprivredi se prati godixi prinos u vinogradu, varirae otkupne ene
kukuruza,... Demografske vremenske serije informixu o promeni broja stanovnika,
prirodnom priraxtaju,... Elektrokardiogram (EKG) je primer medi inske vre-
menske serije na osnovu koje se analizira rad srqanog mixia.
Analiza vremenskih serija se znaqajno razlikuje od klasiqnog statistiqkog
istraivaa koje analizira statistiqku seriju realizovanog uzorka i zakuquje
o popula iji. Poda i vremenske serije, kao i zakuq i, se odnose na jedan statis-
tiqki element (nema ni popula ije ni uzorka). Na primer, maksimalna dnevna
temperatura na odreÆenoj loka iji, dnevni prihod u jednoj prodavni i, broj tu-
rista u nekom hotelu. Osnovna pretpostavka u analizi vremenskih serija jeste
postojae zavisnosti meÆu poda ima. Nivo pojave zavisi od vremena, ali i od
prethodnih vrednosti. Vremenska serija se moe posmatrati kao dvodimenzio-
nalno obeleje (X, Y ) gde je X vreme, a Y pojava, koje se analizira na samo jednom
elementu, ali se odnosi na razliqite trenutke.
Defini ija 2.9.1 Vremenska serija je hronolixki ureÆen niz podataka o nekoj
pojavi (vrednosti nekog obeleja) i odraava varijabilnost pojave tokom vre-
mena. Qine je dva niza podataka iste duine; poda i koji prikazuju inten-
zitet pojave, i hronoloxki niz koji je suk esivan, sa jednakim vremenskim pe-
riodima.
Po prirodi posmatrane pojave, vremenske serije se dele u dve osnovne grupe:
100 POGLAVE 2. STATISTIKA
• momentne - pokazuju nivo pojave u taqno odreÆenim uzastopnim momentima
(stae zaliha robe u maga inu svakog 1. u mese u, broj gostiju u galeriji u
17 qasova, broj upisanih bru oxa svakog 1. oktobra, jutara telesna tem-
peratura pa ijenta, visina snenog pokrivaqa,...).
• intervalne - pokazuju koliqinu pojave u uzastopnim vremenskim interval-
ima (meseqna prodaja, broj diplomiranih studenata tokom xkolske godine,
broj posetila a galerije tokom dana/izlobe, dnevna koliqina padavina,...).
Sabiraem podataka iz intervalne vremenske serije mogu se kreirati nove vre-
menske serije, a kombinovae podataka iz momentne vremenske serije nije smis-
leno.
Vremenske serije mogu da prikazuju i uporedne podatke o dve ili vixe po-
java. Na primer, dvostruka vremenska serija o meseqnoj potroxi na hranu i na
troxkove prevoza.
Grafiqki prikaz vremenske serije je dijagram rasipaa qija horizontalna osa
prikazuje vremenske podatke, a vertikalna posmatranu pojavu. To je jednoznaqna
funk ija/poligonalna linija i naziva se vremenski dijagram. Vremenski di-
jagram moe da prikazuje apsolutni ili relativni tok pojave, tenden ije i oblik
enog razvoja tokom vremena.
Na varija ije podataka unutar vremenske serije utiqu 4 komponente:
• trend, T - je opxta razvojna tenden ija pojave, pokazuje teu same pojave
bez drugih uti aja, odnosi se na dui vremenski period.
• sezonski uti aji, S - zbog ih je nivo pojave u nekim delovima posmatra-
nog razdoba znatno vei ili znatno mai od proseka; na primer, pro-
daja preparata za sunqae je najvea poqetkom leta, u jesen je zanemariva,
poqetkom zime je opet u porastu - uti aj turistiqke sezone.
• ikliqnost, C - uoqava se nakon dugoroqnijeg praea pojave; to je naiz-
meniqno smeivae odstupaa pojave iznad i ispod proseqnih vrednosti;
istovrsna (ali ne obavezno jednaka) odstupaa se pojavuju periodiqno.
• neregularni uti aji, R - svi ostali, nepredvidivi (elementarne nepogode,
xtrajk,...).
Analiza vremenske serije obuhvata analizu varijabilnosti pomou modela vre-
menske serije, odreÆivae pokazatea dinamike koji izraavaju tempo promene
posmatrane pojave i vremenske indekse koji predstavaju odnose razliqitih nivoa
pojave.
• Analiza varijabilnostiAnalizira se svaka od komponenata, pa se pravi model vremenske serije koji
moe biti multiplikativan T ·S·C·R, aditivan T+S+C+R ili kombinovan.
2.9. VREMENSKE SERIJE 101
• Pokazatei dinamike (apsolutni i relativni)- apsolutni porast pojave, APi = yi − yi−1
- tempo porasta, TPi =yi−yi−1
yi
- tempo razvitka, TRi =yi
yi−1, i = 2, . . . , n
- sredi tempo razvitka, STR, log STR = 1n−1
n∑
i=2
log TRi.
• Vremenski indeksi (pojedinaqni i grupni) omoguavaju praee promena
pojave i olakxavaju poreÆee vixe vremenskih serija
- bazni, Ii =yiy1· 100%
- lanqani, Li =yi
yi−1· 100%.
Trend je spe ijalni sluqaj regresije, kada je vreme jedno od posmatranih
obeleja, obiqno X . Trend takoÆe moe biti linearan, paraboliqan, ekspo-
nen ijalan... Trend vremenske serije je funk ija koja izraava varijabilnost
pojave zavisno od vremena. Na vremenskom dijagramu, to je kriva koja sadri
tzv. proseqne taqke, koje bi verovatno bile realizovane da nema ostalih uti aja
(sezonskih, ikliqnih...). Trend se jox naziva i dinamiqka sreda vrednost.
Trend predstava osnovu za pro enu vrednosti pojave van vremenskog niza (in-
terpola ija) i za predviÆae vrednosti izvan perioda obuhvaenog vremenskom
serijom (ekstrapola ija).
Najqexe je u upotrebi linearan trend,
y = ax+ b, a 6= 0.
Pre odreÆivaa parametara a i b, uobiqajeno je da se vremenski niz " entrira"
uzimaem vrednosti simetriqnih u odnosu na 0. Ako je n = 2k+1 onda se uzimaju
vrednosti −k, . . . , 0, . . . , k, a za n = 2k se najqexe koriste ±12,±3
2, . . . ,±2k−1
2.
Tako se dobija
n∑
i=1
xi = 0, pa se a i b raqunaju na jednostavniji naqin (u odnosu na
linearnu regresiju)
a =
n∑
i=1
xiyi
n∑
i=1
x2i
, b =1
n
n∑
i=1
yi. (2.26)
Parametar a je nagib u regresionom modelu i predstava proseqnu promenu vred-
nosti pojave za "jediniqnu promenu vremena". Vrednost b predstava pro enu
vrednosti pojave u " entralnom" trenutku.
102 POGLAVE 2. STATISTIKA
Primer. Kvartalna potroxa elektriqne energije u nekoj firmi je izraena
u MWh. Poda i za prvih xest godina poslovaa firme su u prve tri kolone u
tabeli 2.6. Ostale kolone u tabeli su formirane radi analize vremenske serije
10
odreÆen je linearni trend, apsolutni i relativni pokazatei dinamike vremenske
serije, i indeksi. Kolona x u tabeli entrira, prilagoÆava vremenske podatke.
Primenom rela ije (2.26), sume kolona xy i x2odreÆuju jednaqinu linearnog
trenda
y = 0.41 · x+ 16.3,
koji zanemaruje sezonske i ikliqne uti aje a naglaxava opxti porast potroxe
elektriqne energije, xto je prikazano na sli i 2.5.
Apsolutni APi i reletivni TRi pokazatei dinamike su prikazani u odgo-
varajuim kolonama tabele 2.6, kao i bazni indeksi Ii. Tempo razvitka TRi od-
reÆuje i lanqane indekse Li = TRi ·100%. Sredi tempo razvitka je STR = 125%.
−11.5 −7.5 −3.5 0.5 4.5 8.5
5
10
15
20
25
X
Y
Slika 2.5: Vremenski dijagram i linearni trend potroxe elektriqne energije
10
Vrednosti u kolonama su zaokruivane, pa su i kraji rezultati priblini.
2.9. VREMENSKE SERIJE 103
godina kvartal y x xy x2 APi TRi log TRi Ii
1 I 16 -11.5 -184 132.25
II 9 -10.5 -94.5 110.25 -7 0.563 -0.250 56.25%
III 13 -9.5 -123.5 90.25 4 1.444 0.160 81.25%
IV 12 -8.5 -102 72.25 -1 0.923 -0.035 75.00%
2 I 16 -7.5 -120 56.25 4 1.333 0.125 100.00%
II 10 -6.5 -65 42.25 -6 0.625 -0.204 62.50%
III 15 -5.5 -82.5 30.25 5 1.500 0.176 93.75%
IV 13 -4.5 -58.5 20.25 -2 0.867 -0.062 81.25%
3 I 17 -3.5 -59.5 12.25 4 1.308 0.117 106.25%
II 12 -2.5 -30 6.25 -5 0.706 -0.151 75.00%
III 16 -1.5 -24 2.25 4 1.333 0.125 100.00%
IV 14 -0.5 -7 0.25 -2 0.875 -0.058 87.50%
4 I 19 0.5 9.5 0.25 5 1.357 0.133 118.75%
II 14 1.5 21 2.25 -5 0.737 -0.133 87.50%
III 18 2.5 45 6.25 4 1.286 0.109 112.50%
IV 16 3.5 56 12.25 -2 0.889 -0.051 100.00%
5 I 22 4.5 99 20.25 6 1.375 0.138 137.50%
II 17 5.5 93.5 30.25 -5 0.773 -0.112 106.25%
III 20 6.5 130 42.25 3 1.176 0.071 125.00%
IV 18 7.5 135 56.25 -2 0.900 -0.046 112.50%
6 I 24 8.5 204 72.25 6 1.333 0.125 150.00%
II 19 9.5 180.5 90.25 -5 0.792 -0.101 118.75%
III 21 10.5 220.5 110.25 2 1.105 0.043 131.25%
IV 20 11.5 230 132.25 -1 0.952 -0.021 125.00%
391 0 473.5 1150 0.097
Tabela 2.6: Kvartalna potroxa elektriqne energije, vremenska serija i di-
namiqka analiza
104 POGLAVE 2. STATISTIKA
Poglave 3
Dodatak
U ovom poglavu su izdvojene vanije formule. Prvo se navode osnovni pojmovi
kombinatorike, zatim slede formule iz verovatnoe i posebno iz statistike.
U nastavku su tabli e sa vrednostima funk ija raspodele za tri najvanije
sluqajne promenive i objaxee za ihovu upotrebu:
• Normalna raspodela i Laplasova funk ija• Studentova t-raspodela
• χ2-raspodela
3.1 Kombinatorika
• Permuta ije - prebrojavaju razliqite rasporede n elemenata
- bez ponavaa, Pn = n! = n · (n− 1) · . . . · 2 · 1
- sa ponavaem, Pn
h1,h2,··· ,hk=
n!
h1!h2! · · ·hk!, h1 + h2 + . . .+ hk = n,
gde je hi broj ponavaa i-tog elementa.
• Varija ije - prebrojavaju razliqite ureÆene skupove duine k elemenata
od n elemenata
- bez ponavaa, V nk =
(
n
k
)
· k! = n · (n− 1) · . . . · (n− k + 1), k ≤ n
- sa dozvoenim ponavaem, Vn
k = nk
• Kombina ije - za skup od n elemenata prebrojavaju razliqite podskupove
sa k elemenata
- bez ponavaa, Cnk =
(
n
k
)
=n!
k!(n− k)!, k ≤ n
- sa dozvoenim ponavaem, Cn
k =
(
n+ k − 1
k
)
105
106 POGLAVE 3. DODATAK
3.2 Verovatnoa - formule
• Ω - prostor elementarnih dogaÆaja, P (Ω) = 1
• Klasiqna defini ija verovatnoe: P =m
nm - broj povonih ishoda, n - broj moguih ishoda
• Geometrijska defini ija verovatnoe: P (A) =m(A)
m(Ω)m(A) - geometrijska mera (duina, povrxina, zapremina) skupa A,
m(Ω) - geometrijska mera skupa Ω
• Uslovna verovatnoa
P (A|B) =P (AB)
P (B), P (B) > 0; P (B|A) = P (AB)
P (A), P (A) > 0,
gde je p(AB) = p(A ∩ B)
Vai P (AB) = P (A)P (B|A), P (AB) = P (B)P (A|B)
• Ostvarivi dogaÆaji A i B su nezavisni ako vai
P (AB) = P (A)P (B)⇐⇒ P (A|B) = P (A)⇐⇒ P (B|A) = P (B)
• Potpun sistem dogaÆaja H1, H2, . . . , Hn, n ∈ N
Hi ∩Hj = ∅, za i 6= j, Ω =n⋃
i=1
Hi =n∑
i=1
Hi, P
(
n∑
i=1
Hi
)
=n∑
i=1
P (Hi) = 1
• Formula totalne verovatnoe
P (A) =
n∑
i=1
P (Hi)P (A|Hi) = P (H1)P (A|H1) + . . .+ P (Hn)P (A|Hn)
• Bajesova formula
P (Hi|A) =P (HiA)
P (A)=
P (Hi)P (A|Hi)n∑
i=1
P (Hi)P (A|Hi), i = 1, 2, . . . , n
• Zakon raspodele diskretne sluqajne promenive (SP)
X :
(
x1 x2 . . . xn . . .
p1 p2 . . . pn . . .
)
, p1 + p2 + . . .+ pn + . . . = 1.
• Funk ija raspodele sluqajne promenive X : FX(x) = P (X < x), x ∈ R
P (a ≤ X < b) = FX(b)− FX(a), za svako a, b ∈ R, a < b.
• Bernulijeva raspodela X :
(
0 1
1− p p
)
• Binomna raspodela X : B(n, p)
P (X = k) =
(
n
k
)
pkqn−k, q = 1− p, k = 0, 1, . . . , n
3.2. VEROVATNOA - FORMULE 107
• Poasonova raspodela X : P(λ)
P (X = k) =λk
k!e−λ, λ > 0, k = 0, 1, 2, . . .
• Geometrijska raspodela X : G(p)
P (X = k) = qk−1p, q = 1− p, k = 1, 2, . . .
• Matematiqko oqekivae, disperzija i standardno odstupae
E(X) = x1p1+x2p2+. . .+xnpn+. . . , D(X)=E(X2)−(E(X))2, σ(X)=√
D(X)
• Standardiza ija sluqajne promenive X
X∗ =X − E(X)
σ(X), E(X∗) = 0, D(X∗) = 1
• Zakon raspodele dvodimenzionalne sluqajne promenive:X\Y y1 y2 · · · yk
x1 p11 p12 · · · p1k p1
x2 p21 p22 · · · p2k p2.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
xn pn1 pn2 · · · pnk pn
q1 q2 · · · qk 1
pi = pi1 + pi2 + . . .+ pik
qj = p1j + p2j + . . .+ pnj
p1 + p2 + . . .+ pn = 1
q1 + q2 + . . .+ qk = 1
· Marginalne raspodele:
X :
(
x1 x2 . . . xn
p1 p2 . . . pn
)
, Y :
(
y1 y2 . . . yk
q1 q2 . . . qk
)
· Uslovne raspodele:
P (X = xi|Y = yj) =P (X=xi,Y=yj)
P (Y=yj)=
pijqj, X|Y = yj :
(
x1 x2 . . . xn . . .p1jqj
p2jqj
. . .pnj
qj. . .
)
P (Y = yj|X = xi) =P (Y=yj ,X=xi)
P (X=xi)=
pijpi, Y |X = xi :
(
y1 y2 . . . yn . . .pi1pi
pi2pi
. . . pinpi
. . .
)
108 POGLAVE 3. DODATAK
3.3 Statistika - formule
• Grupisae podataka: poda i → varija ioni niz →statistiqka serija:
- prosta (xi, fi), i = 1, . . . , k
- intervalna (Ii, fi), i = 1, . . . , k,
broj intervala je k, 1 + 3.322 log10 n ≤ k ≤ 5 log10 n,
xirina intervala je h =1
k(xmax − xmin),
gde je f1 + . . .+ fk = n, a n je obim uzorka.
frekven ije: fi - apsolutne,
nxi= f1 + f2 + · · ·+ fi - zbirne apsolutne,
f ∗i = fi
n-relativne,
n∗xi=∑
a≤i
f ∗a = f ∗
1 + f ∗2 + · · ·+ f ∗
i - zbirne relativne.
• Deskriptivna statistika(1) prosta statistiqka serija
uzoraqka aritmetiqka sredina xn =1
n
k∑
i=1
xifi
uzoraqka geometrijska sredina Gn = 10logGn, logGn =1
n
k∑
i=1
fi log xi
uzoraqka harmonijska sredina Hn =n
k∑
i=1
fixi
uzoraqki modus mo = xj ⇔ fj −max
uzoraqka medijana me =
x(n+12 ), n - neparno
x(n2 )+x(n2 +1)
2, n - parno
uzoraqka disperzija s2n =1
n
k∑
i=1
fix2i − (xn)
2,
uzoraqko standardno odstupae sn =√
s2n
korigovana uzoraqka disperzija s2n =1
n− 1
k∑
i=1
fi(xi − xn)2
srede apsolutno odstupae Ad =1
n
k∑
i=1
fi|xi − xn|
3.3. STATISTIKA - FORMULE 109
koefi ijent varija ije v =snxn
· 100%
koefi ijent asimetrije α3 =
1n
k∑
i=1
fi(xi − xn)3
s3n
koefi ijent spoxtenosti α4 =
1n
k∑
i=1
fi(xi − xn)4
s4n
(2) intervalna statistiqka serija
Sve deskriptivne statistiqke mere osim modusa i medijane se raqunaju na
osnovu pridruene proste serije (xsi, fi), i = 1, . . . , k, gde je xsi = mi−1+mi
2
sredina intervala Ii = [mi−1, mi).
modus mo = as−1 + hfs − fs−1
(fs − fs−1) + (fs − fs+1),
gde je Is = [as−1, as) - modalni interval (sa najveom frekven ijom fs),
h - xirina modalnog intervala,
fs−1, fs+1 - frekven ije intervala Is−1 i Is+1.
medijana me = al−1 + hn2− nxl−1
fl,
gde je Il = [al−1, al) - medijalni interval (fl−1 <n2≤ fl),
h - xirina medijalnog intervala,
nxl−1- zbirna apsolutna frekven ija intervala Il−1.
• O ene parametara(1) taqkaste - entrirane, metodom momenata
E(X) = Xn, D(X) = S2n
(2) intervalne - β - nivo poverea, β ∈ (0, 1), β ≈ 1
1 p ∈ I, B(n, p)
I =
(
p− a
√
p(1− p)
n− 1, p+ a
√
p(1− p)
n− 1
)
, p = kn, a = Φ−1(β
2)
2 m ∈ I, N (m, σ), σ-poznato
I =
(
xn − aσ√n, xn + a
σ√n
)
, a = Φ−1(β2)
110 POGLAVE 3. DODATAK
3 m ∈ I, N (m, σ), σ-nepoznato
I =
(
xn − asn√n− 1
, xn + asn√n− 1
)
, a ∈
Φ−1(β2), t
n−1, 1+β
2
4 σ ∈ I, N (m, σ)
I =
(
0,ns2nc
)
, I =
(
ns2na
,ns2nb
)
, c = χ2n−1,β, a = χ2
n−1, 1+β
2
, b = χ2n−1, 1−β
2
• Testirae statistiqkih hipoteza - α-prag znaqajnosti, α ∈ (0, 1), α ≈ 0
1 N (m, σ), σ-poznato, H0(m = m0)
z∗ =xn −m0
σ
√n,
H1 Cα cα
m 6= mo (−∞,−cα) ∪ (cα,∞) Φ−1(1−α2)
m > mo (cα,∞) Φ−1(12− α)
m < mo (−∞,−cα) Φ−1(12− α)
2 N (m, σ), σ-nepoznato, H0(m = m0)
z∗=xn −m0
sn
√n−1,
H1 Cα cα, zavisno od n
m 6= mo (−∞,−cα)∪(cα,∞) Φ−1(1−α2), tn−1;1−α
2
m > mo (cα,∞) Φ−1(12− α), tn−1;1−α
m < mo (−∞,−cα) Φ−1(12− α), tn−1;1−α
3 B(n, p), H0(p = p0)
z∗ =kn− p0
√
p0(1− p0)
√n, Cα - kao u sluqaju 1
4 neparametarski test, H0(F = F0), H1(F 6= F0)
Cα = (cα,∞), cα = χ2k−1−s;1−α
z∗ =k∑
m=1
(fm − n · pm)2n · pm
, pm =
F0(am)− F0(am−1), intervalna st.s.
p(X = xm), prosta st.s.
3.3. STATISTIKA - FORMULE 111
• Regresiona analizakoefi ijent korela ije r =
sxysxsy
gde su sxy =1
n
n∑
i=1
xiyi − xnyn
sx, sy - uzoraqka standardna odstupaa obeleja X i Y
xn, yn - uzoraqke aritmetiqke sredine
regresiona prava y = ax+ b,
a =sxys2x
=sxysxsy
· sysx
= rsysx
, b = yn − axn
• Vremenske serije
entrirae vremenskih podataka,
n∑
i=1
xi = 0,
linearni trend y = ax+ b,
a =
n∑
i=1
xiyi
n∑
i=1
x2i
, b =1
n
n∑
i=1
yi,
pokazatei dinamike
apsolutni porast pojave, APi = yi − yi−1
tempo porasta, TPi =yi−yi−1
yi
tempo razvitka, TRi =yi
yi−1, i = 2, . . . , n
sredi tempo razvitka, STR, log STR = 1n−1
n∑
i=2
log TRi
indeksi
bazni, Ii =yiy1· 100%
lanqani, Li =yi
yi−1· 100%
112 POGLAVE 3. DODATAK
3.4 Vrednosti Laplasove funk ije. Normalna
raspodela
Laplasova funk ija
Φ(x) =1√2π
∫ x
0
e−t2
2 dt, Φ(−x) = −Φ(x), x ≥ 0,
se koristi za izraqunavae vrednosti funk ije raspodele sluqajne promenive
X : N (0, 1) jer ene vrednosti izraavaju povrxinu ispod Gausove krive nad
intervalom (0, x), kao xto je prikazano na sli i 3.1.
−4 −2 2 4
ϕ(x)
x = 1.64
Φ(x)
x
· · · 0.03 0.04 · · ·.
.
.
1.5
1.6 0.4495
.
.
.
p(0 < X < 1.64) = Φ(x) = 0.4495
Slika 3.1: Laplasova funk ija, znaqee vrednosti i upotreba tabli e
• Ako sluqajna promeniva X ima raspodelu N (0, 1), onda je ena funk ija ras-
podele
F (x) =
12+ Φ(x), x ≥ 0,
12− Φ(−x), x < 0.
Na primer, F (−0.37) = 0.5− 0.1443 = 0.3557.
• Inverzna Laplasova funk ija
Φ−1(α) = x ⇔ P (0 ≤ X < x) = α, α ∈ [0, 0.5].
Na primer, Φ−1(0.4761) = 1.98
3.4. VREDNOSTI LAPLASOVE FUNKCIJE. NORMALNA RASPODELA 113
x .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0 0.0 0.004 0.008 0.012 0.016 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.091 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.148 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.17 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.195 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.219 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.258 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.291 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.334 0.3365 0.3389
1 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.377 0.379 0.381 0.383
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.398 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.437 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.475 0.4756 0.4761 0.4767
2 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.483 0.4834 0.4838 0.4842 0.4846 0.485 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.489
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.492 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.494 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.496 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.497 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.498 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.499 0.499
3.1 0.499 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
Tabela 3.1: Vrednosti Laplasove funk ije
114 POGLAVE 3. DODATAK
3.5 Studentova t-raspodela
Funk ija raspodele sluqajne promenive koja ima Studentovu t-raspodelu je
F (t;n) =
t∫
−∞
Γ(
n+12
)
√nπΓ
(
n2
)
(
1 +x2
n
)−n+12
dt,
pri qemu je t argument funk ije a n parametar. ene vrednosti prikazuju ve-
liqinu povrxine ispod krive koja odgovara gustini raspodele (2.2). Na sli i je
prikazan primer za n = 5 stepeni slobode.
−6 −4 −2 0 2 4 6 8
0.1
0.2
0.3
0.4
t = 1.476
F (1.476; 5) = 0.90
t5,0.9 = 1.476
Slika 3.2: Studentova gustina i funk ija raspodele
Oznaka tn,β se koristi za vrednost inverzne funk ije raspodele, za n stepeni
slobode i β vrednost funk ije,
tn,β = t ⇐⇒ F (t;n) = β.
Tabli a 3.2 se koristi na dva naqina:
• da se priblino odredi vrednost funk ije raspodele za dato n i t, npr:
F (2; 25) ≈ F (2.060; 25) = 0.975, F (4; 3) ≈ 0.98, F (4; 20) = 1.
• da se za datu verovatnou β (obiqno nivo poverea) i poznati stepen slobodeodredi tn,β.
3.5. STUDENTOVA T -RASPODELA 115
n\F (t)0.5 0.75 0.9 0.95 0.975 0.99 0.995 0.9995
1 0 1 3.078 6.314 12.706 31.821 63.657 636.619
2 0 0.816 1.886 2.92 4.303 6.965 9.925 31.599
3 0 0.765 1.638 2.353 3.182 4.541 5.841 12.924
4 0 0.741 1.533 2.132 2.776 3.747 4.604 8.61
5 0 0.727 1.476 2.015 2.571 3.365 4.032 6.869
6 0 0.718 1.44 1.943 2.447 3.143 3.707 5.959
7 0 0.711 1.415 1.895 2.365 2.998 3.499 5.408
8 0 0.706 1.397 1.86 2.306 2.896 3.355 5.041
9 0 0.703 1.383 1.833 2.262 2.821 3.25 4.781
10 0 0.7 1.372 1.812 2.228 2.764 3.169 4.587
11 0 0.697 1.363 1.796 2.201 2.718 3.106 4.437
12 0 0.695 1.356 1.782 2.179 2.681 3.055 4.318
13 0 0.694 1.35 1.771 2.16 2.65 3.012 4.221
14 0 0.692 1.345 1.761 2.145 2.624 2.977 4.14
15 0 0.691 1.341 1.753 2.131 2.602 2.947 4.073
16 0 0.69 1.337 1.746 2.12 2.583 2.921 4.015
17 0 0.689 1.333 1.74 2.11 2.567 2.898 3.965
18 0 0.688 1.33 1.734 2.101 2.552 2.878 3.922
19 0 0.688 1.328 1.729 2.093 2.539 2.861 3.883
20 0 0.687 1.325 1.725 2.086 2.528 2.845 3.85
21 0 0.686 1.323 1.721 2.08 2.518 2.831 3.819
22 0 0.686 1.321 1.717 2.074 2.508 2.819 3.792
23 0 0.685 1.319 1.714 2.069 2.5 2.807 3.768
24 0 0.685 1.318 1.711 2.064 2.492 2.797 3.745
25 0 0.684 1.316 1.708 2.06 2.485 2.787 3.725
26 0 0.684 1.315 1.706 2.056 2.479 2.779 3.707
27 0 0.684 1.314 1.703 2.052 2.473 2.771 3.69
28 0 0.683 1.313 1.701 2.048 2.467 2.763 3.674
29 0 0.683 1.311 1.699 2.045 2.462 2.756 3.659
30 0 0.683 1.31 1.697 2.042 2.457 2.75 3.646
40 0 0.681 1.303 1.684 2.021 2.423 2.704 3.551
60 0 0.679 1.296 1.671 2 2.39 2.66 3.46
120 0 0.677 1.289 1.658 1.98 2.358 2.617 3.373
∞ 0 0.674 1.282 1.645 1.96 2.326 2.576 3.291
Tabela 3.2: Vrednosti Studentove t-raspodele
116 POGLAVE 3. DODATAK
3.6 χ2-raspodela
Funk ija raspodele sluqajne promenive
sa χ2-raspodelom je
F (y;n) =
y∫
0
1
2n2 Γ(n
2)x
n2−1e−
x2 dx,
gde je y argument funk ije, a broj ste-
peni slobode n je parametar. Najqexe
korixene vrednosti se nalaze u tabeli
3.3-3.4. Na sli i je prikazana gustina χ2-
raspodele za n = 5 stepeni slobode,
0 2 4 6 8 10 12 140
5 · 10−2
0.1
0.15
y = 9.24
F (9.24) = 0.90
F (9.24; 5) = 0.90 ⇐⇒ χ25,0.9 = 9.24
Koristi se uopxtena posebna oznaka za
inverzne vrednosti funk ije raspodele,
χ2n,β = y ⇐⇒ F (y, n) = β.
Tabli e 3.3-3.4 se mogu koristiti na dva
naqina, sliqno kao i tabli a Studentove
raspodele.
n\F (y)0.005 0.01 0.025
1 3.90E-05 0.00016 0.00098
2 0.01 0.0201 0.0506
3 0.0717 0.115 0.216
4 0.207 0.297 0.484
5 0.412 0.554 0.831
6 0.676 0.872 1.24
7 0.989 1.24 1.69
8 1.34 1.65 2.18
9 1.73 2.09 2.7
10 2.16 2.56 3.25
11 2.6 3.05 3.82
12 3.07 3.57 4.4
13 3.57 4.11 5.01
14 4.07 4.66 5.63
15 4.6 5.23 6.26
16 5.14 5.81 6.91
17 5.7 6.41 7.56
18 6.26 7.01 8.23
19 6.84 7.63 8.91
20 7.43 8.26 9.59
21 8.03 8.9 10.3
22 8.64 9.54 11
23 9.26 10.2 11.7
24 9.89 10.9 12.4
25 10.5 11.5 13.1
26 11.2 12.2 13.8
27 11.8 12.9 14.6
28 12.5 13.6 15.3
29 13.1 14.3 16
30 13.8 15 16.8
Tabela 3.3: χ2-raspodela, I
3.6. χ2-RASPODELA 117
n\F (y)0.05 0.1 0.25 0.5 0.75 0.9 0.95 0.975 0.99 0.995
1 0.0039 0.0158 0.102 0.455 1.32 2.71 3.84 5.02 6.63 7.88
2 0.103 0.211 0.575 1.39 2.77 4.61 5.99 7.38 9.21 10.6
3 0.352 0.584 1.21 2.37 4.11 6.25 7.81 9.35 11.3 12.8
4 0.711 1.06 1.92 3.36 5.39 7.78 9.49 11.1 13.3 14.9
5 1.15 1.61 2.67 4.35 6.63 9.24 11.1 12.8 15.1 16.7
6 1.64 2.2 3.45 5.35 7.84 10.6 12.6 14.4 16.8 18.5
7 2.17 2.83 4.25 6.35 9.04 12 14.1 16 18.5 20.3
8 2.73 3.49 5.07 7.34 10.2 13.4 15.5 17.5 20.1 22
9 3.33 4.17 5.9 8.34 11.4 14.7 16.9 19 21.7 23.6
10 3.94 4.87 6.74 9.34 12.5 16 18.3 20.5 23.2 25.2
11 4.57 5.58 7.58 10.3 13.7 17.3 19.7 21.9 24.7 26.8
12 5.23 6.3 8.44 11.3 14.8 18.5 21 23.3 26.2 28.3
13 5.89 7.04 9.3 12.3 16 19.8 22.4 24.7 27.7 29.8
14 6.57 7.79 10.2 13.3 17.1 21.1 23.7 26.1 29.1 31.3
15 7.26 8.55 11 14.3 18.2 22.3 25 27.5 30.6 32.8
16 7.96 9.31 11.9 15.3 19.4 23.5 26.3 28.8 32 34.3
17 8.67 10.1 12.8 16.3 20.5 24.8 27.6 30.2 33.4 35.7
18 9.39 10.9 13.7 17.3 21.6 26 28.9 31.5 34.8 37.2
19 10.1 11.7 14.6 18.3 22.7 27.2 30.1 32.9 36.2 38.6
20 10.9 12.4 15.5 19.3 23.8 28.4 31.4 34.2 37.6 40
21 11.6 13.2 16.3 20.3 24.9 29.6 32.7 35.5 38.9 41.4
22 12.3 14 17.2 21.3 26 30.8 33.9 36.8 40.3 42.8
23 13.1 14.8 18.1 22.3 27.1 32 35.2 38.1 41.6 44.2
24 13.8 15.7 19 23.3 28.2 33.2 36.4 39.4 43 45.6
25 14.6 16.5 19.9 24.3 29.3 34.4 37.7 40.6 44.3 46.9
26 15.4 17.3 20.8 25.3 30.4 35.6 38.9 41.9 45.6 48.3
27 16.2 18.1 21.7 26.3 31.5 36.7 40.1 43.2 47 49.6
28 16.9 18.9 22.7 27.3 32.6 37.9 41.3 44.5 48.3 51
29 17.7 19.8 23.6 28.3 33.7 39.1 42.6 45.7 49.6 52.3
30 18.5 20.6 24.5 29.3 34.8 40.3 43.8 47 50.9 53.7
Tabela 3.4: χ2-raspodela, II
118 POGLAVE 3. DODATAK
Literatura
1. Nevenka Ai, Statistika, Centar za matematiku i statistiku Fakulteta
tehniqkih nauka, 2012.
2. elimir Branovi, Verovatnoa i statistika sa primerima i zada ima,
drugo izdae, Tehniqki fakultet "Mihajlo Pupin", Zreanin, 2003.
3. Svetozar V. Vukadinovi, Elementi teorije verovatnoe i matematiqke
statistike, xesto izdae, Privredni pregled - Beograd, 1996.
4. Silvija Gilezan i dr., Zbirka rexenih zadataka iz Verovatnoe i Statis-
tike, Novi Sad 2009.
5. Ivana Kovaqevi, Verovatnoa i statistika sa zbirkom zadataka, Uni-
verzitet Singidunum, Beograd 2015.
6. Danijela Rajter-iri, Verovatnoa, tree izdae, Univerzitet u Novom
Sadu, Prirodno-matematiqki fakultet, 2013.
7. Mila Stojakovi, Matematiqka statistika, Univerzitet u Novom Sadu,
Fakultet tehniqkih nauka, 2006.
8. Olga Hai, urÆi a Takaqi, Matematika za studente prirodnih nauka,
Univerzitet u Novom Sadu, Prirodno-matematiqki fakultet, 1998.
9. iana Cvetkovi, Poslovna statistika, Futura publika ije, Novi Sad,
2006.
119
top related