comp ens are masuratorilor si statistic a

Upload: benciuflorin

Post on 06-Apr-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    1/20

    COMPENSARE MSURTORILOR I STATISTIC

    REFERATUL NUMRUL 2

    GEODEZIE , AN II , SERIA A , GRUPA 1

    Silviu tefan BENCIUSilviu tefan BENCIUSilviu tefan BENCIUSilviu tefan BENCIU

    TEMA 2 Numrul de ordine : 3

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    2/20

    2 | P a g i n a

    I.

    II.

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    3/20

    3 | P a g i n a

    :

    Variabile aleatoareDac ne referim la o singur msurtoare, variabila aleatoareeste acea mrime care n cadrul unuiexperiment poate lua o valoare necunoscut aprioric.

    Dac valorile numerice ale unui ir de date aparin mulimii numerelor ntregi sau raionale atunci sedefinete o variabil aleatoare discret. In cazul apartenenei valorilor la mulimea numerelor reale se definete ovariabila aleatoare continu.

    Funcia de repartiie

    Funcia de repartiie a unei variabile aleatoare este definit prin .Funcia de repartiie, calculat pentru x, msoar ansa ca variabila aleatoare X ia valori mai mici sau egale cu x (sau cualte cuvinte exprim probabilitatea evenimentului). Cunoaterea funciei de repartiie a unei variabila aleatoare permite

    calcularea probabilitilor cu care variabila aleatoare ia valori n anumite intervale.Propieti:

    1. .2. adic funcia de repartiie este o funcia nedescresctoare (constantele deintegrare tind la 0).3. Dac variabile posibile ale variabilei aleatoare aparin intervalului (a ; b) , atunci:

    Consecin:

    Densitatea de probabilitate (sau curba densitii de probabilitate)Se numete densitate de probabilitate, prima derivat (dac exist) a funciei de repartiie :

    pentru suficient de mic, avem:

    Funcie de densitate de probabilitate (sau funcia de repartiie)

    Pentru o variabil aleatoare continu, numim densitate de probabilitate acea funcie (dac exist) astfel nctfuncia de repartiie se poate calcula prin relaia:

    Funcia de repartiie este, n acest caz, absolut continu, care are rolul de a descrie frecvena relativ (valoarea atept) a diferitelor valori pentru variabilele aleatoare.

    Funcia densitate de probabilitate permite calculul probabilitii ca variabila aleatoare s aparin unui interval:

    = (aria de sub graficul lui limitat de i), unde ,O curba a densitii de repartiie (repartiie) este curb care are acelai aspect cu curba ctre care tinde poligonul

    frecvenelor relative, atunci cnd numarul de valori dintr-o serie tinde la infinit, iar lungimea fiecarei clase tinde la 0. Legtura care exist ntre variabila aleatoare i probabilitatea de apariie a acesteia poart denumire de lege de

    repartiie. Legea de repartiie se poate reprezenta grafic sub forma diagramei cu bare (Fig.4.1), histograme, poligonulrepartiiei .

    ExpresiaP(X

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    4/20

    4 | P a g i n a

    Distribuia NORMAL i NORMAL STANDARDIZAT

    : OBSERVAIE 1:

    1. Am notat cu

    media aritmetica simpl a unui eantion.

    2. Am notat cu media aritmetic simpl a populaiei.n teoria probabilitilor distribuia normal (sau Gaussian)

    este o distribuie de probabilitate continu, care este deobicei folosit ca prim aproximaie s descrie valorile reale alevariabilelor aleatoare cere tind s se strng n jurul unei valori medii. Graficul asociatfunciei de densitate de probabilitate estecurb sub form de clopot, i este cunoscut sub numele defuncia Gauss saucurba clopot:

    unde parametrul este media sau valoarea ateptat (locaia de vrf) i este variana, dispersia teoretic; este abatereastandard teoretic sua eroarea medie de ptrati. Distribuia cu = 0 i = 1 estenumit distribuianormal standardizat .

    Cel mai simplu caz de o distribuie normal este cunoscut sub numele dedistribuianormal standardizat, descris defuncia de densitate de probabilitate (sau densitatea de repartiie normal pentru distribuia normal standardizat) astfel:

    Fie funcia de form ptratic:

    Mai degrab dect folosind a, b, c este mult mai comun pentru a descrie o

    distribuie normal de ctre variabilele sale medie i dispersia teoretic . Modificarea acestor parametri (a, b, c) ne permite sa rescriemfunciade densitate de probabilitate ntr-o form standard mai convenabil:

    Astfel, cnd o variabila aleatoare este distribuit n mod normal, cu

    media i variana, scriem

    OBSERVAIE 2:

    Pentru s fie o funcie de densitate de probabilitate adevrat peste, trebuie s alegem c, astfel nct

    (care este posibil numai atunci cnd a

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    5/20

    5 | P a g i n a

    Funcie de distibuie cumulat (FDC) a distibuiei normale este dat relaia explicat mai sus astfel:

    pentru .

    Cu notaia LAPLACE obinem:

    unde:

    reprezint funcia Laplace i ale crei valori sunt date n anexa tabelul I.

    Verificarea normalitii cu testul (sau ipoteza): TEST UNILATERAL DREAPTADEFINIIE 1:

    Ipoteza nul ( )n testarea ipotezelor statistice, prin ipoteza nul se nelege acea ipotez sub care se poate preciza repartiia statisticii

    testului. Astfel, ipoteza nul este cea falsificabil (pentru care se poate decide falsitatea, n sensul paradigmei falsificabilitiidin filosofia cercetrii tiinifice nu se tie dac este adevrat sau fals) pe baza datelor experimentale. De regul, ipotezanul exprim c nu este prezent ceva, c nu exist nici un efect, c nu exist nici o diferen (de unde i motivaia istoric atermenului de ipotez nul), iar celelalte sunt ipotezealterenative i se aleg n direcia de respingere a ipotezei nule( ).DEFINIIE 2:

    Ipotez alternativ ( )n testarea ipotezelor statistice, o ipoteza nul (cu semnificaiatipic a lipsei unui efect) este opus unei negaii a ei, ipotezaalternativ (semnificnd uzual existena aparent a unuiefect). Ipoteza nul constituie baza raionamentului prin carese calculeaz probabilitatea de apariie a situaiei observate.Dac aceast probabilitate este suficient de mic (princomparaia cu un prag de semnificaie fixat), atunci se spune c datele de sondaj nu susin ipoteza nul i aceasta esterespins n favoarea ipotezei alternative. Este de remarcat c aceast decizie nu nseamn c situaia observat estecaracteristic ipotezei alternative, sau c ipoteza nul este fals, sau c ipoteze alternativ este adevrat.

    Fie o statistic sauparametru, iar , valori ale unei statistici.Ipotezele se numesc ipoteze admisibile. Prin valoare de probabilitate (volumul seleciei) asociat ipotezei nule,pentru setul de date considerat, se nelege cel mai micnivel de semnificaie pentru care ipoteza nul se respinge ntoate testele.

    Astfel, ntr-un test unilateral (cum este i cazul de fa), dac este statistica testului i notm cu xp valoarea carese deteremin din tabel funcie dep valoarea critic (de la care ncepe, sau de la care se termin regiunea/zon critic)

    astfel nct respingem pentru < xp (nu aparine regiunea critic), notm cu xvaloarea observat a lui X , atuncivaloare de probabilitate pentru -p - ipoteza nul i observaiile disponibile este cea mai mic valoare nct x < xp. Se refer latestarea ipotezelor. O eroare de genul I apare atunci cnd ipoteza nul este respins n moderonat (ea fiind adevrat). O eroare de genul IIse refer la situaia cnd ipoteza nul nu este respins dei ea este fals.

    Riscul (probabilitatea) apariiei unei erori de tip I este egal cu nivelul(pragu) de semnificaie, .

    k =

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    6/20

    6 | P a g i n a

    Riscul (probabilitatea) unei erori de tip II se noteaz cu , diferena 1 - constituind puterea testului{ }.OBSERVAII 3:

    1. Cu ct probabilitate erorilor de genul I i II sunt mai mici cu att testul este mai bun. Acest lucu se poate reliza prinextinderea eantionului (submultime a populaiei).2. Decizi n testarea ipotezelor este strns legat de intervalul de ncredere.3. Teste- folosit este pentru un singur eantion. Testul -pentru un eantion permite detectarea existenei unei distribuiin interiorul setului de date.

    Statistica este utilizat pentru a msura potrivirea dintre date categoriale i un model multinomial(model deforma: i = 1, 2, . . . , kkkk , decip1 +p2 + . . . +pk= 1) care prognozeaz recvena relativ a rezultatelor din fiecare categorieposibil. S presupunem c exist nnnn ncercri independente, fiecare avnd un rezultat din kkkk posibile. Presupunem c nfiecare ncercare probabilitatea de apariie a rezultatului iiii esteppppiiii, iiii = 1, 2, . . . , kkkk, aceleai pentru toate ncercrile.Pentru orice iiii, numrul de apariii a rezultatului i este atunci valoarea atepatat (sperana matematic - fat de medie) este:

    ....

    Dac modelul este corect i neste suficient de mare, atunci distribuia de sondaj a statisticii tinde ctre odistribuie cu k - 1 grade de libertate (k = ).

    Decizia statistic pentru testul chi-ptrat se bazeaz pe compararea valorii calculatecu o valoare critic, corespunztoarenivelului alfa ales (0.05 sau, opional, mai mic).

    Am notat cu numrul de apariii observate ale rezultatului (scorului) de tip in cele n ncercri, i =1, 2, . . . , k. Statistica rezum atunci discrepanele dintre valorile ateptate i valorile observate prin :

    Ipoteza h zero :

    Pentru a verifica ipoteza cu ipoteza alternatiav vom folosi statistica (variabil aleatoare lipsit de parametri

    necunoscui) :

    pentru dat (fixat), gsete valoarea critic U() din tabelele repartiiei

    nu n-1 grade de libertate (valori sunt date n anexa

    tabelul II).

    OBSERVAIE 4:

    Se determin astfel nct 1. Urmatoarele condiii sunt cele mai comune situaii n care distribuia(repartiia) apare din distribuia Gauss simpl (normala/standard):Dac sunt variabile aleatoare indentice independentdistribuite adic

    atunci

    unde

    NUME TEST STATISTIC

    DISTRIBUIADISTRIBUIA

    NECENTRALIZATDISTRIBUIA DISTRIBUIA

    NECENTRALIZAT

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    7/20

    7 | P a g i n a

    III.

    1. Fiind dat setul de date ce reprezint rezultatul msurrii unei direcii de 50 de ori, se cere s se verificenormalitatea:

    grafic (cu ajutorul histogramei i a poligonului frecvenelor) -> clopotul GAUSS analitic (cu testul 2)

    2.2.1. S se calculeze probabilitatea de .2.2. S se calculeze intervalul de probabilitate de 28% .

    Nr. crt. Xi Xi cresctor Xi - Xm e d (Xi - Xmed)^2

    1 36.48 30.24 0.878 0.770

    2 34.95 31.50 -0.653 0.4263 32.90 31.91 -2.702 7.3034 37.70 32.20 2.097 4.3975 37.82 32.39 2.217 4.915

    6 36.80 32.51 1.197 1.4337 35.13 32.55 -0.473 0.2248 37.11 32.82 1.507 2.2719 32.82 32.90 -2.783 7.745

    10 32.20 33.08 -3.403 11.58011 37.05 33.11 1.447 2.094

    12 36.68 33.33 1.077 1.16013 33.11 33.35 -2.493 6.21514 33.08 33.59 -2.523 6.36615 41.65 33.70 6.047 36.566

    16 35.08 33.77 -0.523 0.27417 39.11 34.22 3.507 12.29918 32.39 34.44 -3.213 10.32319 40.34 34.88 4.737 22.43920 38.80 34.95 3.197 10.221

    21 37.55 35.08 1.947 3.791

    22 37.68 35.12 2.078 4.31623 33.70 35.40 -1.903 3.62124 30.25 35.44 -5.353 28.65525 37.25 36.01 1.647 2.71326 32.55 36.05 -3.053 9.321

    27 33.59 36.26 -2.013 4.05228 34.22 36.27 -1.383 1.91329 36.27 36.32 0.667 0.44530 37.99 36.48 2.387 5.69831 31.50 36.68 -4.103 16.83532 36.32 36.70 0.717 0.51433 36.70 36.80 1.097 1.20334 36.26 36.80 0.657 0.43235 36.01 37.05 0.407 0.166

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    8/20

    8 | P a g i n a

    Nr. crt. Xi Xi cresctor Xi - Xm e d (Xi - Xmed)^2 36 34.88 37.11 -0.723 0.52337 32.51 37.25 -3.093 9.56738 33.33 37.36 -2.273 5.167

    39 38.17 37.55 2.567 6.589

    40 35.44 37.68 -0.163 0.027

    41 33.77 37.70 -1.833 3.360

    42 34.44 37.82 -1.163 1.35343 39.39 37.99 3.787 14.341

    44 35.40 38.17 -0.203 0.041

    45 37.36 38.30 1.757 3.087 46 36.80 38.80 1.197 1.43347 36.05 39.11 0.447 0.20048 31.92 39.39 -3.683 13.564

    49 33.35 40.34 -2.253 5.07650 38.30 41.65 2.697 7.274

    N =50

    1780,120 0,1200 304,4866

    Media35,602

    Calculul valorile medii:

    Calculul dispersiilor (abaterea medie patratic) teoretice:

    Calculul dispersiilor (abaterea medie patratica) de selecie:

    Lungimea clasei/grupei/intervalului este:

    Xmin = 30,24Xmax= 41,65

    Amplitudinea intervalului este:

    Calculul numrului de apariii (frecvene) pentrufiecare clas/grup/interval:

    ni =f(i) (unde f(i) este frecvena absolut) ni = N = 50

    S^2 = 6.214

    S = 2.493

    = 1.246 / 2 = 0.623

    ^2 = 6.090

    = 2.468

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    9/20

    9 | P a g i n a

    CLASE

    ( 31.240 ] 1 31.240 -1.750 0.040 0.040 2.000 0.500

    ( 31.240 32.486 ] 4 32.486 -1.250 0.106 0.066 3.300 0.148

    ( 32.486 33.733 ] 10 33.733 -0.750 0.227 0.121 6.050 2.579

    ( 33.733 34.979 ] 5 34.979 -0.250 0.401 0.174 8.700 1.574

    ( 34.979 36.226 ] 6 36.226 0.250 0.599 0.198 9.900 1.536

    ( 36.226 37.472 ] 12 37.472 0.750 0.773 0.174 8.700 1.252

    ( 37.472 38.718 ] 7 38.718 1.250 0.894 0.121 6.050 0.149

    ( 38.718 39.965 ] 3 39.965 1.750 0.960 0.066 3.300 0.027

    ( 39.965 ) 2 1 0.040 2,000 0,000

    CONTROL 50 1 50 7,766

    CLASA L sup Frecvena

    ( 28,748 ; 29,994 ] 29,994 0

    ( 29,994 ; 31,240 ] 31,240 1

    ( 31,240 ; 32,486 ] 32,486 4

    ( 32,486 ; 33,733 ] 33,733 10

    ( 33,733 ; 34,979 ] 34,979 5

    ( 34,979 ; 36,226 ] 36,226 6

    ( 36,226 ; 37,472 ] 37,472 12

    (37,472 ; 38,718 ] 38,718 7

    ( 38,718 ; 39,965 ] 39,965 3

    ( 39,965 ; 42,211 ] 42,211 2( 42,211 ; 43,457 ] 43,457 0

    Verificarea normalitii cu testul (sau ipoteza)Pentru a efectua testul-, pentru nceput enunm cele doua ipoteze:

    (ipoteza nulului)

    (ipoteza alternativ)Pentru a efectua testul - trebuie facui urmtorii pai:1) Se calculeaza valoarea (sau distibuia) cu ajutorul relatiei :

    2) Se determin folosind tabelul distribuiei - :Presupunem c dorim o precizie de 95% n enuntarea concluziei, deci p = 0,95 (vrem s fim 95% siguri de

    corectitudinea concluziei rezultate n urma testului). n acest caz vom folosi un nivel de semnificatie " risc " care

    se calculeaz n modul devenit deja cunoscut:

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    10/20

    10 | P a g i n a

    Gradul de libertate se calculeaza cu o relatie ( identica cu cea folosita la distribuia-t):

    doar ca, n cazul distributiei -, n reprezinta numrul de clase/grupe/categori.

    Pentru exemplul nostru = 0,05 si f= 6 . Valoarea, corespunzatoare unui nivelde semnificaie de 0,05 i unui grad de libertate egal cu 6, se noteaza i este egala cu:

    unde :f numrul gradelor de libertate (sau df - degrees of freedom);

    coeficientul de risc de genul I (nivel/prag de semnificaie sau ncredere se ami noteaz a);

    p valoare de probabilitate (volumul seleciei sau siguran statistic);

    n este numrul de clase/grupe/categori i

    k este numrul de necunoscute care n cazul nostru este dou (deoarece se cunoate media).

    ( valoarea critic)3) Considerm ipotezele:

    Ipoteza h zero :

    Ipoteza alternativ:

    Se compar cu ( la fel ca n cazul testului t).

    Daca

    , atunci respingem ;Daca

    atunci acceptam ;

    n cazul dat

    deci trebuie s respingem ipoteza alternativului i automatacceptm ipoteza nulului .

    n consecin putem spune c suntem 95% siguri c exist o repartiie normal, atunci ntre valorile date se

    respect distribuia normal (distribuia Gauss).Trebuie remarcat ca rezultatul acestui test ne spune c exist cel

    putin o regiune ( regiunea critic ) care este diferit de cealalt.

    OBSERVAII 5:

    Determinarea caracteristicilor deciziei statistice:

    1. alegem =0.05 (n cazul testului decizia nu poate fi dect unilateral dreapta, deoarece acest test nupoate lua valori pozitive);

    2. gsim valoarea critic pentru n tabela pentru distribuia, pentru i .3. Mai putem aduga c acest set de valori nu este afectat de erori grosolana sau greeli ci doar de erori aleatoare(erori sistematice factorilor care actioneaza n acelasi mod).

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    11/20

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    12/20

    12 | P a g i n a

    reprezint funcia Laplace i ale crei valori sunt date nanexa tabelul I.

    i

    ,

    atunci

    i duc ladeterminarea probabilitii astfel c:

    . OBSERVAIE 6:

    1. Se convertete distribuia normal n distribuia normal standardizat.2. pentru a identifica aria de sub curba de repartiie aplicnd TESTUL Z probabilitatea cutat.3. 4 6. Intervalul de ncredere al distribuiei este dat de :

    2.2. S se calculeze intervalul de probabilitate de 28% .

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    13/20

    13 | P a g i n a

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    14/20

    14 | P a g i n a

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    15/20

    15 | P a g i n a

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    16/20

    16 | P a g i n a

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    17/20

    17 | P a g i n a

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    18/20

    18 | P a g i n a

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    19/20

    19 | P a g i n a

    ANEX:TABELUL I

  • 8/3/2019 Comp Ens Are Masuratorilor Si Statistic A

    20/20

    TABELUL II