· 2010. 10. 15. · cap tulo 1 estat stica descritiva 1.1 introdu˘c~ao 1.1.1 estat stica a...

82
Cap´ ıtulo 1 Estat´ ıstica Descritiva 1.1 Introdu¸c˜ ao 1.1.1 Estat´ ıstica A palavra estat´ ıstica deriva do latim ”status”e tem dois significados dis- tintos. Frequentemente usado no plural, o termo estat´ ıstica designa todo conjunto coerente de dados num´ ericos relativos a um grupo de indiv´ ıduos. Assim, por ex- emplo, pode-se falar em estat´ ısticas de produ¸c˜ ao industrial ou agr´ ıcola (quantidades produzidas, custos de produ¸c˜ ao, pre¸cos de venda, etc), de estat´ ısticasdemogr´aficas (natalidade, mortalidade), de estat´ ısticas de desemprego, de acidentes de estrada, etc. Por outro lado, a palavra estat´ ıstica designa tamb´ em, o conjunto de m´ etodos que permitem reunir e analisar dados de observa¸ c˜ao. De acordo com Fisher -“A Estat´ ıstica ´ e a matem´atica aplicada a dados de observa¸ ao”. Ela tem por objetivo o uso de m´ etodos cient´ ıficos para coleta, organiza¸ ao, resumo, apresenta¸ c˜ao e an´alise de dados, bem como a obten¸c˜ ao de conclus˜oes v´alidas a serem utilizadas nas tomadas de decis˜oes. Assim todo estudo estat´ ıstico pode ser decomposto em pelo menos duas fases: - a reuni˜ao ou coleta dos dados estat´ ısticos - sua an´alise e interpreta¸ ao. A coleta de dados pode ser realizada de duas formas: 1

Upload: others

Post on 06-Feb-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

  • Caṕıtulo 1

    Estat́ıstica Descritiva

    1.1 Introdução

    1.1.1 Estat́ıstica

    A palavra estat́ıstica deriva do latim ”status”e tem dois significados dis-

    tintos. Frequentemente usado no plural, o termo estat́ıstica designa todo conjunto

    coerente de dados numéricos relativos a um grupo de indiv́ıduos. Assim, por ex-

    emplo, pode-se falar em estat́ısticas de produção industrial ou agŕıcola (quantidades

    produzidas, custos de produção, preços de venda, etc), de estat́ısticas demográficas

    (natalidade, mortalidade), de estat́ısticas de desemprego, de acidentes de estrada,

    etc.

    Por outro lado, a palavra estat́ıstica designa também, o conjunto de métodos

    que permitem reunir e analisar dados de observação.

    De acordo com Fisher -“A Estat́ıstica é a matemática aplicada a dados

    de observação”. Ela tem por objetivo o uso de métodos cient́ıficos para coleta,

    organização, resumo, apresentação e análise de dados, bem como a obtenção de

    conclusões válidas a serem utilizadas nas tomadas de decisões.

    Assim todo estudo estat́ıstico pode ser decomposto em pelo menos duas

    fases:

    - a reunião ou coleta dos dados estat́ısticos

    - sua análise e interpretação.

    A coleta de dados pode ser realizada de duas formas:

    1

  • 2

    - por simples observação dos fenômenos em que se tem interesse - estudo

    observacional e

    - por experimentação, ou seja, provocando-se voluntariamente a aparição

    de certos fenômenos controlados.

    A análise estat́ıstica pode ser decomposta em duas etapas, uma dedutiva ou

    descritiva e a outra indutiva. A Estat́ıstica Descritiva tem por objetivo resumir e

    apresentar os dados observados sob a forma de: tabelas (descrição tabular), gráficos

    (descrição gráfica) e parâmetros e suas estimativas (descrição paramétrica).

    A Inferência Estat́ıstica permite estender ou generalizar dentro de certas

    condições as conclusões obtidas. Frequentemente, a observação ou a experimentação

    é relativa a apenas uma fração dos indiv́ıduos em que se tem interesse. As conclusões

    relativas a essa fração, chamada amostra, devem, então, ser estendidas tanto quanto

    posśıvel ao conjunto de indiv́ıduos que formam a “população”. Essa fase indutiva

    comporta evidentemente certos riscos de erro, que podem ser medidos, usando-se a

    teoria das probabilidades. Quando em um estudo trabalha-se com amostras, tem-se

    uma pesquisa por amostragem. Quando se utiliza a população toda tem-se o censo.

    As diferentes etapas de todo estudo estat́ıstico não são, entretanto, independentes.

    1.1.2 Variáveis

    Variável é uma medida ou classificação obtida de cada elemento da população

    ou amostra. A representação de dados torna-se mais fácil por meio da utilização

    de variáveis. É importante notar que a variável aleatória é representada por letra

    maiúscula e o valor observado pela mesma letra, porém minúscula. Assim, por

    exemplo, os dados apresentados na Tabela 1.1, a variável X refere-se ao peso de 24

    animais do Cerrado brasileiro, em kg. Tem-se ainda que xi, i = 1, ..., 24, representa

    o peso observado de um determinado animal i, por exemplo,

    x1 = 250, x2 = 20, x3 = 10, ..., x24 = 60.

    Outro exemplo pode ser

  • 3

    Tabela 1.1: Peso de 24 animais do Cerrado brasileiro, em kg.

    Animal X Animal X Animal X

    Anta 250 Gato-do-mato 3 Cateto 20

    Ariranha 20 Gato-maracajá 6 Preá 1

    Bugio-preto 10 Gato-mourisco 10 Quati 5

    Cachorro-do-mato 8 Jaguatirica 15 Raposa-do-campo 8

    Capivara 70 Lobo-guará 20 Suçuarana 60

    Cervo 100 Lontra 10 Tamanduá-bandeira 30

    Cotia 3 Onça-pintada 100 Tatu-bola 3

    Gambá 1 Paca 8 Veado-do-campo 60

    Y : tipos de famı́lias de algumas espécies de plantas encontradas no Parque

    Nacional da Serra da Canastra

    yj: Asteraceae, Bignoniaceae, Melastomataceae, j = 1, 2, 3 (famı́lias).

    Os tipos de variáveis mais comumente utilizadas na descrição de dados são:

    Variáveis

    Quantitativas

    discretascont́ınuasQualitativas

    nominaisordinaisa) Variáveis quantitativas representam quantidades. Podem ser de natureza

    discreta ou cont́ınua.

    São de natureza discreta as variáveis que podem assumir apenas valores den-

    tro do conjunto dos números naturais. Exemplo: número de frutos por ramo, número

    de parasitas por hospedeiro, número de ovos por ninho, número de sementes germi-

    nadas, número de insetos coletados em armadilhas, número de brotos em estudos de

    cultura de tecidos, etc.

  • 4

    São de natureza cont́ınua as variáveis que podem assumir qualquer valor em

    um intervalo. Exemplo: alturas de plantas, pesos de animais, velocidade de animais,

    concentração de uma solução, biomassa de plantas ou animais, etc.

    b) Variáveis qualitativas descrevem categorias, qualidades. São relativas a

    dados categorizados. Exemplo: raça, sexo, cor da pele, táxon, grau de infecção, etc.

    É posśıvel, às vezes, estabelecer uma correspondência dessas variáveis com

    variáveis quantitativas discretas. É o caso, por exemplo, de:

    sexo: masculino, feminino ⇒ xi = 0, 1, i = 1, 2

    condição: morto, vivo ⇒ xi = 0, 1, i = 1, 2

    graus de infecção: ⇒ xi = 0, 1, 2, 3, i = 1, 2, 3, 4.

    1.1.3 Somatório

    É uma notação bastante utilizada dentro da estat́ıstica. Considere, por

    exemplo, a variável aleatória X, que representa o número de espécimes de zarro-

    americano (Aythya affinis) coletados ao longo dos anos de 1965 a 1980, conforme a

    Tabela 1.2.

    Tabela 1.2: Número de espécimes de zarro-americano (Aythya affinis) coletados ao

    longo dos anos de 1965 a 1980.

    Ano 1965 1966 1967 1968 1969 1970 1971 1972

    Números 19 28 4 13 28 36 17 30

    Ano 1973 1974 1975 1976 1977 1978 1979 1980

    Números 21 32 34 16 22 16 23 31

    Tem-se, então, que x1 = 19, x2 = 28, ..., x16 = 31. Logo, o total de zarros-

    americanos coletados de 1965 a 1980 é dado por

    T = x1 + x2 + ...+ x16 =16∑i=1

    xi = x. = 370

  • 5

    Figura 1.1: Zarro americano.

    Podem ser obtidas, ainda, a soma dos quadrados e o quadrado da soma

    16∑i=1

    x2i = x21 + x

    22 + ...+ x

    216 = 9706

    e (16∑i=1

    xi

    )2= (x1 + x2 + ...+ x16)

    2 = 3702 = 136900.

    Outro exemplo, seria o da Tabela 1.3 que mostra o número médio de ca-

    marões-espinho coletados na báıa de Ubatuba de acordo com o local no qual o tran-

    secto foi feito e com o estágio reprodutivo do camarão.

    Tabela 1.3: Números médios de camarões-espinho coletados na báıa de Ubatuba

    de acordo com o local no qual o transecto foi feito e com o estágio reprodutivo do

    camarão.

    Transecto

    Estágio j = 1 j = 2 j = 3 j = 4 j = 5 j = 6 Totais

    Ov́ıgero y11 = 4,0 y12 = 7,0 y13 = 4,5 y14 = 1,0 y15 = 5,5 y16 = 3,5 y1. = 25,5

    Não-ov́ıgero y21 = 3,0 y22 = 6,5 y23 = 5,0 y24 = 2,0 y25 = 5,0 y26 = 3,5 y2. = 25,0

    Totais y.1 = 7,0 y.2 = 13,5 y.3 = 9,5 y.4 = 3,0 y.5 = 10,5 y.6 = 7,0 y.. = 50,5

  • 6

    Pode-se representar cada valor observado por yij, isto é, yij é o número

    de camarões-espinho referente ao i-ésimo estágio reprodutivo e j-ésimo transecto.

    Assim, tem-se, por exemplo

    y.. =2∑

    i=1

    6∑j=1

    yij = y11 + · · ·+ y16 + y21 + · · ·+ y26 = 50, 5

    y1. =6∑

    j=1

    y1j = y11 + · · ·+ y16 = 25, 5

    y.2 =2∑

    i=1

    yi2 = y12 + y22 = 13, 5

    Propriedades do somatório:

    a)n∑

    i=1

    k = nk

    b)n∑

    i=1

    kxi = kn∑

    i=1

    xi

    c)n∑

    i=1

    (xi ± yi) =n∑

    i=1

    xi ±n∑

    i=1

    yi

    d)n∑

    i=1

    (xi ± k) =n∑

    i=1

    xi ± nk.

    1.2 Estat́ıstica Descritiva

    Tem por objetivo resumir e apresentar dados de observação (população ou

    amostra), de modo a simplificar sua interpretação por meio de descrição tabular,

    gráfica ou paramétrica.

    1.2.1 Variável Qualitativa – Descrição Tabular e Gráfica

    Primeiro caso: Uma só variável

    Seja o exemplo que se segue. Os alunos da sexta turma de Ciências Biológicas

    da ESALQ/USP observaram durante dois dias o número de visitas de polinizadores

    a um espécime de Heliconia rostrata. Obtiveram os resultados: das 8h às 10h, 10h

  • 7

    às 12h, 12h às 14h e das 14h às 16h, respectivamente, 17, 28, 18 e 19 polinizadores

    visitaram a planta.

    Figura 1.2: Heliconia rostrata.

    A representação tabular é feita por meio de tabelas de mono-entrada ou de

    classificação simples ou tabelas de frequências. As frequências podem ser absolu-

    tas simples, absolutas acumuladas, relativas simples, relativas acumuladas, depen-

    dendo do interesse do pesquisador. Uma tabela e mesmo um gráfico deve apresentar:

    cabeçalho, corpo e rodapé.

    O cabeçalho deve conter o suficiente para que sejam respondidas as questões:

    o quê? (fato), onde? (lugar) e quando? (época). O corpo é apresentado por colunas

    e sub-colunas dentro das quais serão registrados os dados. O rodapé é reservado

    para as observações pertinentes, bem como para a identificação da fonte dos dados.

    Assim, para o exemplo dado, tem-se a Tabela 1.4.

    A descrição gráfica, dentre outras, pode ser feita de três formas: gráfico

    de colunas (ou barras), de linhas e de setores circulares. Esses gráficos podem ser

    obtidos considerando-se frequência absoluta, frequência relativa, frequência absoluta

    acumulada e frequência relativa acumulada.

    a) Gráfico de colunas e de linhas

    Os resultados da Tabela 1.4 podem ser representados graficamente como

    mostra a Figura 1.3.

  • 8

    Tabela 1.4: Número de visitas de polinizadores a um espécime de Heliconia rostrata

    observados por alunos da sexta turma de Ciências Biológicas da ESALQ-USP no ano

    de 2009, em dois dias de observação.

    Intervalo Frequência Frequência Freq. abs. Freq. rel.

    (xi) absoluta (fi) relativa (f′i) acumulada acumulada

    08:00-10:00 17 0,207 17 0,207

    10:00-12:00 28 0,341 45 0,548

    12:00-14:00 18 0,220 63 0,768

    14:00-16:00 19 0,232 82 1,000

    82 1,000 - -

    08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00

    Horário

    me

    ro d

    e v

    isita

    s

    05

    10

    15

    20

    25

    30

    05

    10

    15

    20

    25

    30

    Horário

    me

    ro d

    e v

    isita

    s

    08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00

    Figura 1.3: Gráficos de colunas e de linhas para o número de polinizadores observa-

    dos.

    b) Gráfico de setores circulares

    É a representação gráfica, em um ćırculo, por meio de setores. É utilizado,

    principalmente, quando se pretende uma visualização em relação ao total. Para cons-

  • 9

    trúı-lo, divide-se o ćırculo em setores, cujas áreas serão proporcionais às frequências.

    Essa divisão pode ser feita por regra de três. Assim, no exemplo dado

    82 visitas− 360o

    x1 = 74o37′48′′

    17 visitas− x1

    82 visitas− 360o

    x2 = 122o58′48′′

    28 visitas− x2

    x3 = 79o01′12′′, x4 = 83

    o24′36′′.

    08:00−10:0010:00−12:00

    12:00−14:00

    14:00−16:00

    34,1% 20,7%

    22,0% 23,2%

    Figura 1.4: Gráfico de setores circulares para o número de polinizadores observados.

    Segundo caso: duas variáveis

    Se no exemplo de visitas de polinizadores a um espécime de Heliconia ros-

    trata, além da variável “ńıvel”, também, for considerada a variável “dia de coleta”, os

    resultados obtidos podem ser representados em uma tabela de dupla-entrada, como

    a Tabela 1.5.

    A descrição gráfica pode ser feita por meio dos gráficos de colunas e de

    linhas, dentre outras, agrupando-se as colunas por dia de coleta ou por intervalos de

    coletas, conforme é mostrado na Figura 1.5.

  • 10

    Tabela 1.5: Número de visitas de polinizadores a um espécime de Heliconia rostrata

    observados por alunos da sexta turma de Ciências Biológicas da ESALQ-USP no ano

    de 2009, em dois dias de observação.

    Hora Primeiro dia Segundo dia Total

    08:00-10:00 9 8 17

    10:00-12:00 13 15 28

    12:00-14:00 9 9 18

    14:00-16:00 10 9 19

    Total 41 41 82

    Primeiro dia Segundo dia

    05

    1015

    8−10

    10−12

    12−14

    14−16

    8−10

    10−12

    12−14 14−16

    08:00−10:00 10:00−12:00 12:00−14:00 14:00−16:00

    05

    1015

    1

    2

    1

    2

    1 2

    1

    222

    Figura 1.5: Gráficos de colunas para o número de polinizadores observados.

    1.2.2 Variável Quantitativa Discreta – Descrição Tabular e

    Gráfica

    Primeiro caso: Uma só variável

    a) Tabela Primitiva ou Tabela de Dados Brutos – É a tabela inicial dos

    dados, geralmente, sem qualquer critério que permita informações “estat́ısticas”.

    Assim, por exemplo, em uma pesquisa em sala de aula pode-se solicitar a quinze

    alunos que digam o número de pessoas que moram em suas casas, enfatizando que a

  • 11

    Tabela 1.6: Um exemplo de tabela de frequências.

    xi fi

    x1 n1

    x2 n2

    · · · · · ·

    xV nV

    Total N =∑

    i fi

    “honestidade”moral cient́ıfica da coleta de dados pode ser mais importante do que

    o próprio método estat́ıstico adotado na análise desses dados. À medida que os

    alunos vão dando a informação solicitada, os dados vão “entrando”, sem um critério

    espećıfico.

    Outro exemplos seriam dados coletados no campo, como, por exemplo,

    número de sementes germinadas, número de plantas doentes, etc.

    b) Rol – É a tabela de dados dispostos em ordem, geralmente, crescente (ou

    decrescente)

    Apesar de pouco informativa apresenta algumas vantagens sobre a tabela

    primitiva, pois facilmente se obtêm os valores de

    - limite inferior: l ou LI

    - limite superior: L ou LS

    - amplitude total: A = L− l ou A = LS − LIApresenta desvantagens quando o conjunto de dados é grande.

    c) Tabela de Frequências – As duas tabelas anteriores são usadas, em geral,

    apenas para “controle”do pesquisador. Quando a pesquisa é publicada, a tabela

    de frequências é a que deve ser apresentada: espaço de publicação, quantidade de

    informação, etc. Esse tipo de tabela contém, no caso mais simples duas colunas,

    uma com os valores observados (xi) e a outra com as frequências absolutas (fi),

    como mostrado na Tabela 1.6. Podem também, ser inclúıdas colunas com frequências

  • 12

    Tabela 1.7: Número de pessoas que moram nas casas de 15 alunos amostrados.

    .

    xi fi ai a′i pi Fi

    3 3 3 15 0,2 0,2

    4 4 7 12 0,27 0,47

    5 5 12 8 0,33 0,80

    6 1 13 3 0,07 0,87

    7 1 14 2 0,07 0,94

    8 1 15 1 0,07 1,00

    absolutas acumuladas, frequências relativas, frequências relativas acumuladas.

    Suponha que na pesquisa com os quinze alunos sobre o número de pes-

    soas que moram em suas casas, os resultados obtidos foram aqueles apresentados na

    Tabela 1.7 em que ai é a frequência acumulada direta do valor xi, a′i é a frequência

    acumulada inversa do valor xi, pi é a frequência relativafiN

    do valor xi e Fi é a

    frequência relativa acumulada direta do valor xi.

    Será visto, posteriormente, que a frequência relativa é um “bom”estimador

    de probabilidade e que Fi é um “bom”estimador da função acumulada de probabili-

    dade.

    Graficamente as variáveis quantitativas discretas são descritas por meio de

    gráficos de linhas e de barras.

    Segundo caso: Duas ou mais variáveis

    Exemplo: Na mesma pesquisa com os 15 alunos, pode-se solicitar para infor-

    marem dentre os moradores quantos são “assalariados”, obtendo-se os dados brutos,

    o rol das n-uplas, ordenando-se por uma das variáveis e uma tabela de dupla-entrada,

    em que a variável aleatória X representa o número de moradores por residência e

    a variável aleatória Y representa o número de assalariados, conforme mostrado na

    Tabela 1.8.

  • 13

    Tabela 1.8: Tabela de frequências, classificada de acordo com o número de pessoas

    que moram nas casas de 15 alunos amostrados e número de assalariados.

    X

    Y 2 3 4 5 6 Totais (f.j)

    1 1 1 1 1 0 4

    2 0 1 3 2 1 7

    3 0 1 2 1 0 4

    Totais (fi.) 1 3 6 4 1 15

    Note que as frequências marginais de X reproduzem a tabela já constrúıda

    quando se considerou apenas a variável X. De modo análogo pode ser feito para a

    variável Y . Além disso,

    ∑ij

    fij =∑i

    fi =∑j

    fj = N = número de dados

    A tabela de dupla entrada pode ser constrúıda com frequências relativas.

    1.2.3 Variável Quantitativa Cont́ınua – Descrição Tabular e

    Gráfica

    Primeiro caso: Uma só variável

    a) Tabela primitiva ou tabela de dados brutos

    Exemplo: Os dados da Tabela 1.9 referem-se a peso de 50 colmos de cana-

    de-açúcar (em g).

    b) Rol – Ordenando-se os dados obtêm-se os limites inferior e superior e a

    amplitude total.

    l = LI = 10, 20

    L = LS = 22, 10

    A = 22, 10− 10, 20 = 11, 90.

  • 14

    Tabela 1.9: Peso de 50 colmos de cana-de-açúcar (em g).

    14,11 16,12 17,78 13,54 17,59 17,09 17,26 20,35 13,34 20,08

    14,77 13,61 14,85 17,76 17,46 16,08 14,14 15,06 20,67 17,60

    15,26 14,17 16,39 12,00 15,55 14,78 20,48 20,04 16,78 13,59

    19,70 19,56 19,18 19,21 15,94 19,12 20,90 17,11 14,06 19,38

    19,36 16,07 22,10 14,62 18,05 10,20 16,51 20,39 15,63 14,30

    c) Tabela de classes

    Note que ao contrário das variáveis discretas, as variáveis cont́ınuas apresen-

    tam muitos valores diferentes. Desse modo, uma tabela de frequências teria muitas

    linhas e seria, portanto, pouco explicativa. Para contornar esse problema, usam-se,

    para descrever as variáveis cont́ınuas, tabelas de classes ou tabelas de intervalos.

    Faz-se, então, a partição do rol em intervalos de amplitude, geralmente, iguais de-

    nominadas classes.

    O número ideal de classes de uma tabela depende, muitas vezes, mais do

    bom senso do pesquisador do que de regras ŕıgidas pré-estabelecidas. Não há uma

    fórmula exata. Boas aproximações podem ser obtidas por:

    (i)

    k =

    ≤ 5 se N ≤ 25≃ √N se N > 25(ii) Sturges k ≃ 1 + 3, 22 log(N).

    A amplitude de cada classe é obtida por n =A

    k. No exemplo dado, tem-se

    k =√50 ≈ 7 e h = 22, 10− 10, 20

    7= 1, 7

    Os gráficos mais comumente usados para descrever as variáveis quantitativas

    cont́ınuas, são histograma e poĺıgono de frequência, usando-se frequências absolutas,

    e ogivas de Galton crescente ou decrescente, usando-se frequências acumuladas.

    O histograma é constitúıdo de uma sequência de retângulos justapostos em

  • 15

    Tabela 1.10: Tabela de frequências simples (fi), simples acumuladas crescentes (ai),

    simples acumuladas decrescentes (a′i), relativas simples (P̂i), relativas acumuladas

    (Fi) para os dados da Tabela 1.9, mi representa o ponto médio do intervalo.

    Peso mi fi ai a′i P̂i Fi

    10,0 ⊢ 12,0 11,0 1 1 50 0,02 0,02

    12,0 ⊢ 14,0 13,0 5 6 49 0,10 0,12

    14,0 ⊢ 16,0 15,0 14 20 44 0,28 0,40

    16,0 ⊢ 18,0 17,0 14 34 30 0,28 0,68

    18,0 ⊢ 20,0 19,0 8 42 16 0,16 0,84

    20,0 ⊢ 22,0 21,0 7 49 8 0,14 0,98

    22,0 ⊢ 24,0 23,0 1 50 1 0,02 1,00

    que cada retângulo tem como base a amplitude de classe e como altura a freqüência

    da classe que descreve. O poĺıgono de frequências consiste de uma linha poligo-

    nal fechada que une os pontos Pi(mi, fi), i = 1 · · · , k. Para “fechar”o poĺıgono

    de frequências, supõe-se uma classe imediatamente anterior e outra imediatamente

    posterior, ambas com frequências nulas e procede-se de modo análogo.

    Pesos de colmos de cana−de−açúcar

    Freq

    uênc

    ias

    0 10 20 30 40

    01

    23

    4

    05

    1015

    4 12 20 28 36

    Figura 1.6: Histograma e ogivas de Galton para os dados de pesos de colmos de

    cana-de-açúcar.

  • 16

    A ogiva de Galton crescente consiste de uma linha poligonal que une os

    pontos Pi(Li, ai), enquanto que a ogiva de Galton decrescente consiste de uma linha

    poligonal que une os pontos Pi(li, a′i).

    O histograma e as ogivas de Galton para os dados de pesos de colmos de

    cana-de-açúcar, estão representados na Figura 1.6.

    1.3 Descrição paramétrica

    1.3.1 Introdução

    Os dados relativos a uma variável quantitativa, apresentados em uma tabela,

    dão visão geral do problema em estudo. Entretanto, é extremamente conveniente

    proceder a uma descrição dos dados usando-se medidas que mostrem, de maneira

    bastante concisa, certas caracteŕısticas da amostra.

    As medidas de tendência central, também chamadas medidas de posição,

    estabelecem o valor em torno do qual os dados se distribuem. Estão entre elas:

    média aritmética, média geométrica, média harmônica, média quadrática, mediana,

    quartis, decis, percentis e moda.

    As medidas de dispersão permitem quantificar a variabilidade dos valores

    observados, ao redor de um parâmetro de posição. Estão entre elas: amplitude total,

    variância, desvio-padrão, erro-padrão da média, coeficiente de variação (medida de

    dispersão relativa), desvio-quartil, desvio semi-quart́ılico e desvio quartil reduzido.

    As medidas de assimetria medem o grau de simetria de uma distribuição en-

    quanto que as medidas de curtose medem o grau de achatamento de uma distribuição.

    Estão entre elas: coeficientes de Pearson e coeficientes de Fisher.

    Uma distribuição pode ser: simétrica, assimétrica positiva ou assimétrica

    negativa e, ainda, leptocúrtica, mesocúrtica ou platicúrtica.

    Existem, ainda, as medidas de associação que envolvem a dispersão de pon-

    tos referentes a duas variáveis, e podem ser citadas: covariância e coeficiente de

    correlação.

  • 17

    Resta lembrar que para a maioria dos parâmetros, deve-se considerar, sepa-

    radamente, o caso de séries estat́ısticas (uma simples enumeração das observações)

    e aquele das distribuições de frequências considerando-se tabelas de frequências e de

    classes de frequências.

    É prefeŕıvel, geralmente, proceder à redução paramétrica dos dados, dire-

    tamente, a partir dos valores observados, mesmo se as distribuições de frequências

    foram estabelecidas, por exemplo, em vista da representação gráfica dos resultados.

    Em particular, é preciso evitar efetuar a redução dos dados a partir de distribuições

    grupadas em classes.

    1.3.2 Medidas de tendência central ou de posição

    Estabelecem o valor em torno do qual os dados se distribuem.

    1.3.2.1 Média aritmética

    Primeiro caso: Dados não agrupados

    Dado um conjunto de N valores

    ΩX = {x1, x2, . . . , xN}

    define-se a média aritmética como

    x̄ =x1 + x2 + . . .+ xN

    N.

    Os śımbolos x̄, m̂ ou µ̂ representam estimativas da média m ou µ da popu-

    lação. Os śımbolos m e µ representam os parâmetros da população.

    Como exemplo, sejam os dados de produção de cana-de açúcar da Tabela

    1.9. Tem-se:50∑i=1

    xi = 839, 69 N = 50 x̄ = 16, 8g.

  • 18

    Segundo caso: Dados colocados sob a forma de tabelas de frequências

    Seja a Tabela 1.11 de frequências.

    Tabela 1.11: Tabela de frequências

    xi fi xifi

    x1 f1 x1f1

    · · · · · · · · ·

    xk fk xkfk

    Totais N =k∑

    i=1

    fi

    k∑i=1

    xifi

    A média aritmética é obtida por

    m̂ = x̄ =

    k∑i=1

    xifi

    k∑i=1

    fi

    .

    Tabela 1.12: Número de moradores por residência, de 15 alunos amostrados.

    xi fi xifi

    3 3 9

    4 4 16

    5 5 25

    6 1 6

    7 1 7

    8 1 8

    Totais 15 71

    Exemplo: Considerando-se o exemplo do número de moradores por

    residência, de 15 alunos amostrados, pode-se construir a Tabela 1.12, a partir da

  • 19

    qual se obtém a média aritmética

    x̄ =71

    15= 4, 7 moradores por residência.

    Terceiro caso: Dados colocados sob a forma de tabelas de classes de frequências

    Seja a Tabela 1.13 de classes de frequências. A média aritmética é obtida

    Tabela 1.13: Tabela de classes de frequências.

    Classes mi fi mifi

    c1 ⊢ c2 m1 f1 m1f1c2 ⊢ c3 m2 f2 m2f2· · · · · · · · · · · ·

    ck ⊢ ck+1 mk fk mkfk

    Totais N =k∑

    i=1

    fi

    k∑i=1

    mifi

    por

    x̄ =

    k∑i=1

    mifi

    N,

    em que mi é o ponto médio da classe e N =k∑

    i=1

    fi.

    Propriedades da média aritmética:

    1)N∑i=1

    (xi − x̄) = 0

    As diferenças di = xi−x̄ são chamadas desvios, discrepâncias ou afastamento

    de cada xi em relação a x̄.

    2)∑N

    i=1 (xi − x̄)2 = 0 é mı́nima, isto é, a soma dos quadrados dos desvios

    de cada observação xi em relação a uma medida de posição k é a menor posśıvel

    quando k é a média aritmética.

  • 20

    Exemplo: Considere os dados de peso de 50 colmos de cana-de-açúcar da

    Tabela 1.9 com a Tabela 1.14 de classes de frequências. A média aritmética é obtida

    Tabela 1.14: Tabela de classes de frequências para os dados da Tabela 1.9.

    Peso mi fi mifi

    10,0 ⊢ 12,0 11,0 1 11,0

    12,0 ⊢ 14,0 13,0 5 65,0

    14,0 ⊢ 16,0 15,0 14 210,0

    16,0 ⊢ 18,0 17,0 14 238.0

    18,0 ⊢ 20,0 19,0 8 152,0

    20,0 ⊢ 22,0 21,0 7 147,0

    22,0 ⊢ 24,0 23,0 1 23,00

    Totais 50 846

    por

    x̄ =846

    50= 17g.

    1.3.2.2 Mediana

    É um parâmetro de posição tal que a metade das observações lhe são infe-

    riores (ou iguais) e a outra metade superiores (ou iguais).

    Primeiro caso: dados não-agrupados

    Feita a ordenação dos n dados a mediana é dada por

    md = xn+12

    se n é ı́mpar, e

    md =xn

    2+ xn

    2+1

    2se n é par.

    Exemplo: Um estudo foi conduzido com adolescentes mulheres que sofriam

    de bulimia e os resultados das medidas de entrada calórica diária (kcal/kg) estão na

  • 21

    Tabela 1.15. A mediana é dada por

    md =x12 + x13

    2=

    21, 6 + 22, 9

    2= 22, 25

    Tabela 1.15: Medidas de entrada calórica diária (kcal/kg) de 24 adolescentes mulhe-

    res.

    15,9 18,9 25,1 16,0 19,6 25,2

    16,5 21,5 25,6 17,0 21,6 28,0

    17,6 22,9 28,7 18,1 23,6 29,2

    18,4 24,1 30,9 18,9 24,5 30,6

    Outro exemplo: As alturas (cm) de nove alunos do terceiro ano do curso de

    Ciências Biológicas da ESALQ/USP, 2009 foram

    X: { 172; 180; 183; 183; 185; 187; 189; 189; 191}.

    A mediana é dada por

    md = x5 = 185.

    Segundo caso: dados colocados sob a forma de tabelas de frequências

    Distribuição do número de moradores por residência, de 15 alunos sorteados

    no terceiro ano de Ciências Biológicas, 2009

    xi fi a′i

    3 3 3

    4 4 7

    5 5 12

    6 1 13

    7 1 14

    8 1 15

    md = x 15+12

    = x8 = 5

  • 22

    Terceiro caso: dados colocados em uma tabela de classes de frequências

    Um modo de se obter a mediana é por meio de um processo gráfico,

    utilizando-se a Ogiva de Galton. No exemplo de dados de bulimia tem-se a Ogiva

    de Galton.

    Figura 1.7: Ogiva de Galton crescente para os dados de bulimia

    Tabela 1.16: Tabela de classes de frequências para os dados da Tabela 1.15.

    Peso mi fi

    15,9 ⊢ 18,9 17,4 7

    18,9 ⊢ 21,9 20,4 5

    21,9 ⊢ 24,9 23,4 4

    24,9 ⊢ 27,9 23,4 3

    27,9 ⊢ 30,9 26,4 4

    30,9 ⊢ 33,9 29,4 1

    Totais 24

    Outro modo de se obter a mediana é usando-se a fórmula

    md = lmd +(N2−∑

    fi)h

    fmd

  • 23

    em que lmd é o limite inferior da classe mediana,∑

    fi é a soma das frequências

    anteriores à classe mediana, h é a amplitude da classe mediana e fmd é frequência

    da classe mediana.

    Para os dados de bulimia da Tabela 1.15, com tabela de classes de frequências

    na Tabela 1.16, tem-se

    md = 20, 4 +242− 75

    · 3 = 23, 4.

    1.3.2.3 Moda

    É o elemento de uma série de dados que ocorre com maior frequência.

    Primeiro caso: dados não-agrupados

    No exemplo de dados não agrupados de bulimia (Tabela 1.15), a moda é

    igual a 18,9, pois aparece duas vezes enquanto que as outras observações apare-

    cem apenas uma vez. Para o exemplo de alturas de alunos, as modas são 183 e 189cm.

    Segundo caso: dados agrupados em uma tabela de frequências

    Para o exemplo de número de moradores por residência, de 15 alunos do ter-

    ceiro ano de Ciências Biológicas, 2009, a moda é Mo = 5 (é o valor xi correspondente

    à maior frequência fi)

    xi 3 4 5 6 7 8

    fi 3 4 5 1 1 1

    Terceiro caso: dados agrupados em uma tabela de classes de frequências

    Uma maneira de se obter a moda é por meio de um processo gráfico,

    utilizando-se o histograma de frequências simples. No exemplo de cana-de-açúcar,

    tem-se Mo = 18, 23, conforme Figura 1.8.

    Outro modo de se obter a moda é usando-se a fórmula de Czuber

    Mo = l +∆1

    ∆1 +∆2.h

  • 24

    Figura 1.8: Histograma dos pesos de colmo de açúcar com cálculo da moda.

    em que l é o limite inferior da classe modal, ∆1 é a diferença entre a frequência

    da classe modal e a imediatamente anterior, ∆2 é a diferença entre a frequência da

    classe modal e a imediatamente posterior e h é a amplitude da classe.

    Para os dados da Tabela 1.15 com Tabela 1.16 de classes de frequências,

    tem-se

    Mo = 15, 9 +7

    7 + 2.3 = 18, 23.

    1.3.2.4 Média geométrica

    Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, se os dados forem não agrupa-

    dos, a média geométrica é obtida por

    x̄g = n√x1.x2 . . . xN =

    n

    √√√√ N∏i=1

    xi.

    Se os dados estiverem em uma tabela de classes de frequências, então,

    x̄g =n

    √√√√ N∏i=1

    xfii

    sendo xi a média da classe i com frequência fi.

    Exemplo: Durante o primeiro semestre do ano de 1970 a relação

    x =preço de gasolina

    preço do óleo diesel

  • 25

    foi x1 = 2, 50 e no segundo semestre foi x2 = 2, 00. Então,

    mgx =√2× 2, 5 =

    √5 = 2, 236

    Note que se y = 1x⇒ y1 = 12,5 e y2 =

    12. Logo,

    mgy =

    √1

    2, 5× 1

    2=

    √1

    5= 0, 447 =

    1

    mgx.

    Se fosse utilizada a média aritmética, ter-se-ia

    x̄ ̸= 1ȳ.

    1.3.2.5 Média harmônica

    É utilizada no cálculo de velocidades médias e custo médio de bens comprados com

    uma quantia fixa. Dado o conjunto de N valores ΩX = {x1, x2, . . . , xN}, para dados

    não agrupados, a média harmônica é

    x̄h =N

    1x1

    + 1x2

    + . . .+ 1xN

    =N∑Ni=1

    1xi

    isto é, é o inverso da média aritmética dos inversos dos valores.

    Para dados em tabelas de frequências

    x̄h =N∑ki=1

    fixi

    .

    Exemplo: As cidades A, B e C são equidistantes umas das outras. Um

    motorista viaja de A para B a 30km/h de B para C a 60 km/h e de C para A a 120

    km/h. Qual a velocidade média desenvolvida no percurso?

    x̄h =3

    130

    + 160

    + 1120

    = 51, 428km/h.

  • 26

    1.3.2.6 Média quadrática

    É utilizada, principalmente, na determinação de diâmetro de árvores de secção ou

    área média. Dado o conjunto de valores ΩX = {x1, x2, . . . , xN}, para dados não-

    agrupados, a média quadrática é

    x̄q =

    √x21 + x

    22 + . . .+ x

    2N

    N=

    √∑x2i

    N.

    Para dados em tabelas de frequências,

    x̄q =

    √1

    N

    ∑fix2i .

    1.3.2.7 Separatrizes: Decis, Quartis e Percentis

    Quartis dividem um conjunto de dados ordenados em quatro partes iguais, enquanto

    que os decis em dez partes iguais e os percentis em cem partes iguais. Assim, têm-se

    três quartis (Q1, Q2, Q3), nove decis (D1, D2, ...,D9) e noventa e nove percentis (P1,

    P2,...,P99). Tem-se, ainda, que Md = Q2 = D5 = P50.

    O processo gráfico utilizado para a determinação dessas separatrizes é seme-

    lhante ao utilizado para a mediana, a partir da Ogiva de Galton. Quanto às fórmulas

    tem-se:

    Q1 =lQ1 + (

    N4−∑

    fi)

    fQ1 .h.

    1.3.2.8 Relação entre média, mediana e moda

    Em uma distribuição simétrica observa-se que

    x̄ = md = mo.

  • 27

    Figura 1.9: Exemplo de uma distribuição simétrica

    Em uma distribuição assimétrica positiva observa-se que x̄ > md > mo

    enquanto que na assimétrica negativa x̄ < md < mo.

    1.3.3 Medidas de dispersão

    1.3.3.1 Introdução

    As medidas de tendência central, embora de extrema importância, não são suficientes

    para o estudo completo das distribuições.

    Exemplo inicial: Em um ensaio de cana-de-açúcar em que se testaram três

    variedades foram obtidas as produções:

    variedade A: 86,0 87,0 88,0 88,0 88,0 89,0 90,0

    variedade B: 84,0 86,0 88,0 88,0 88,0 90,0 92,0

    variedade C: 87,0 87,0 88,0 88,0 88,0 89,0 89,0.

    Verifica-se que:

    x̄A = x̄B = x̄C = 88, 0∑

    x2 = 54218 s2 = 1, 67

    mdA = mdB = mdC = 88, 0∑

    x2 = 54248 s2 = 6, 67

    moA = moB = moC = 88, 0∑

    x2 = 54212 s2 = 0, 67.

  • 28

    Tornam-se necessárias, portanto, outras medidas para se fazer a escolha de

    uma determinada variedade. Um novo critério, então, poderia ser: a variedade mais

    regular, isto é, a variedade cujas produções apresentam menor dispersão.

    1.3.3.2 Amplitude total

    É a mais rudimentar das medidas de dispersão. É a diferença entre o maior e o

    menor dos valores de uma série de dados.

    A = xmax − xmin

    No exemplo dado:

    AA = 4, 0 AB = 8, 0 AC = 2, 0

    Tem a desvantagem de levar em consideração apenas os valores extremos.

    1.3.3.3 Desvio (di) em relação à média

    Primeiro caso: dados não agrupados

    di = xi − x̄ na amostra

    e

    di = xi − µ na população

    Segundo caso: dados em tabelas de classes de frequências

    di = mi − x̄

    Fato:∑

    di =∑

    (xi − x̄) =∑

    xi − nx̄ = 0

    1.3.3.4 Variância

    É a mais importante das medidas de variação e é definida como a média dos

    quadrados dos desvios.

  • 29

    Primeiro caso: dados não agrupados

    População: σ2 =

    ∑(xi − µ)2

    n=

    1

    n

    [∑x2 − (

    ∑x)2

    n

    ]

    Amostra: s2 =

    ∑(xi − x̄)2

    n− 1=

    1

    n− 1

    [∑x2 − (

    ∑x)2

    n

    ]Nota: Perde-se um grau de liberdade ao estimar-se σ2 com base na

    estimativa da média.

    No exemplo de peso das três variedades de cana-de-açúcar:

    s2A = 1, 67 s2B = 6, 67 s

    2C = 0, 67

    Poder-se-ia, portanto, nesse caso escolher a variedade C.

    No exemplo de dados de produção de cana-de-açúcar (t/ha), da Tabela 1.9,

    tem-se

    ∑x2 = 14445, 64

    ∑x = 839, 69

    s2 =1

    50− 1(14445, 64− 839, 69

    2

    50

    )= 7, 02g2

    Segundo caso: dados em tabelas de frequências

    σ2 =1

    n

    ∑fi(xi − µ)2 =

    1

    n

    [∑fix

    2i −

    (∑

    fixi)2

    n

    ]

    s2 = 1n−1

    ∑fi(xi − x̄)2 =

    1

    n− 1

    [∑fix

    2i −

    (∑

    fixi)2

    n

    ]

    Exemplo: Distribuição do número de moradores por residência

  • 30

    xi fi fixi fix2i

    3 3 9 27

    4 4 16 64

    5 5 25 125

    6 1 6 36

    7 1 7 49

    8 1 8 64

    15 71 365

    s2 =1

    14

    [365− 71

    2

    15

    ]= 2, 07

    Terceiro caso: dados em tabelas de classes de frequências

    s2 =1

    n− 1

    k∑i=1

    fi(mi − x̄)2 =1

    n− 1

    [∑fim

    2i −

    (∑

    fimi)2

    n

    ]sendo mi é o ponto médio da classe i e n =

    ∑fi

    Em outro exemplo de dados de produção de cana-de-açúcar (t/ha) tem-se:

    mi fi mifi m2i fi

    74,0 ⊢ 79,2 76,6 4 306,4 23470,24

    79,2 ⊢ 84,4 81,8 5 409,0 33456,20

    84,4 ⊢ 89,6 87,05 14 1218,0 105966,00

    89,6 ⊢ 94,8 92,2 7 645,4 59505,88

    94,8 ⊢ 100,0 97,4 2 194,8 18973,52

    100,0 ⊢ 105,2 102,6 4 410,4 42107,04

    3184,0 283478,88

    s2 =1

    35

    [283478, 88− 3184, 0

    2

    36

    ]=

    1871, 7689

    35= 53, 4791 ≃ 53, 48t/ha

  • 31

    1.3.3.5 Desvio-padrão

    Observando-se a fórmula para o cálculo da variância, vê-se que o numerador é uma

    soma de quadrados. Assim, se a unidade foi, por exemplo, metro (m), tem-se que

    a variância será dada em m2. Para se voltar à variável original, necessita-se, então,

    extrair a raiz quadrada da variância que é o desvio-padrão. Assim, tem-se:

    População: σ =√σ2

    Amostra: s =√s2

    s =√53, 48 = 7, 32 dados de cana-de-açúcar agrupados

    s =√2, 07 = 1, 44 dados de habitantes por residência

    1.3.3.6 Coeficiente de variação

    Trata-se de uma medida relativa de dispersão, útil para a comparação em termos

    relativos do grau de concentração em torno da média de séries distintas. É dado por:

    População: CV =σ

    µou CV (%) = 100 · σ

    µ

    Amostra: CV =s

    x̄ou CV (%) = 100 · s

    x̄Para efeitos práticos, costuma-se considerar que CV superior a 50% indica

    alto grau de dispersão e, consequentemente, pequena representabilidade da média.

    Enquanto que para valores inferiores a 50% a média será tanto mais representativa

    do fato quanto menor for o seu CV. O coeficiente de variação mede o desvio-padrão

    em unidades da média.

    Assim se temos duas amostras de peso (em kg) de gado Canchim aos 8 meses

    Amostra A: 347, 380, 328, 410, 380, 348, 329, 320, 330, 305

    Amostra B: 350, 343, 325, 348, 334, 327, 317, 342, 341, 330

    x̄A = 347, 7 x̄B = 335, 7

    s2A = 1067, 79 s2B = 116, 9

    sA = 32, 68 sB = 10, 81

    CVA = 0, 094 CVB = 0, 032

  • 32

    Portanto, vê-se que a dispersão relativa da amostra B é menor do que a da

    amostra A.

    1.3.3.7 Erro-padrão da média

    Obtido por

    σ(x̄) =σ√n

    para população

    s(x̄) =s√n

    para amostra

    Pode ser verificado que médias e desvios-padrão são por si mesmos sujeitos

    à variação e formam populações de médias e de desvios-padrão.

    Espera-se que médias sejam menos variáveis que observações individuais.

    Assim, o erro-padrão da média é uma medida de dispersão de um conjunto de

    médias, utilizando-se apenas uma média. Nos exemplos dados, tem-se:

    s(x̄) =7, 09√36

    = 1, 182 para dados de cana-de-açúcar não-agrupados

    s(x̄) =3, 31√36

    = 0, 552 para dados de cana-de-açúcar agrupados

    s(x̄) =1, 44√15

    = 0, 372 para dados de habitantes por residência

  • Caṕıtulo 2

    PROBABILIDADES

    2.1 Conceituação

    2.1.1 Experimento Aleatório (E)

    É aquele que repetido sob as mesmas condições pode levar a resultados

    diferentes, isto é, não se pode prever seu resultado, em razão do fato de que todos

    os fatores que determinam o resultado não podem ser medidos ou controlados.

    Exemplos:

    E1: Lançar uma moeda e observar o resultado da face voltada para cima.

    E2: Lançar duas moedas e observar o resultado das faces voltadas para cima.

    E3: Lançar dez moedas e observar o número de caras.

    E4: Lançar um dado e observar o número mostrado na face de cima.

    E5: Lançar dois dados e observar o número mostrado na face de cima.

    E6: Lançar dois dados e observar a soma dos números mostrados na face de

    cima.

    E7: Plantar 10 sementes de feijão e observar o número de sementes germi-

    nadas.

    E8: Fazer o cruzamento de dois animais e observar o sexo do animal que

    nasceu.

    Analisando esses experimentos verifica-se:

    a) Cada experimento poderá ser repetido sob as mesmas condições in-

    definidamente.

    33

  • 34

    b) Não se conhece um particular valor do experimento “a priori”, porém,

    podem-se descrever todos os posśıveis resultados - as possibilidades.

    c) Quando o experimento for repetido um grande número de vezes, surgirá

    uma regularidade, isto é, haverá uma estabilidade da fração f =s

    n(frequência re-

    lativa), em que o número n é o número de repetições e s é o número de sucessos

    de um particular resultado estabelecido antes da realização. Essa caracteŕıstica é

    fundamental para o cálculo da probabilidade de um certo evento. Assim,

    n

    f

    2.1.2 Espaço Amostral

    É o conjunto de todos os resultados posśıveis associados a um experimento,

    representado por S. Sendo S um conjunto, ele poderá ser finito ou infinito. Nos

    exemplos dados

    a) E1 : S1 = {k, c} em que c = cara, k = coroa

    b) E2 : S2 = {(c, c), (c, k), (k, c), (k, k)}

    c) E3 : S3 = {0, 1, 2, ..., 10}

    d) E4 : S4 = {1, 2, 3, 4, 5, 6}

    e) E5 : S5 = {(1, 1), (1, 2), (1, 3), ..., (6, 6)}

    f) E6 : S6 = {2, 3, 4, ..., 12}

    g) E7 : S7 = {0, 1, 2, ..., 10}

    h) E8 : S8 ={fêmea, macho}

  • 35

    2.1.3 Evento

    É um subconjunto de S, ou seja, um conjunto de resultados de um experi-

    mento. Nos exemplos dados

    a) A1: sair cara ⇒ A1 = {c}

    b) B1: sair pelo menos uma cara ⇒ B1 = {(c, c), (k, c), (c, k)}

    c) C1: não sair cara ⇒ C1 = {0}

    d) D1: sair o três ⇒ D1 = {3}

    e) X1: sair o par (5, 6) ⇒ X1 = {(5, 6)}

    f) F1: sair soma onze ⇒ F1 = {(5, 6), (6, 5)}

    g) G1: pelo menos 8 sementes germinaram ⇒ G1 = {1, 2, 3, ..., 8}

    h) H1: nascer macho ⇒ H1={macho}.

    Tipos de Eventos

    Evento Imposśıvel – aquele que nunca ocorre. Representado por ∅. Por

    exemplo, no jogo de dois dados sair soma 13.

    ∅ = {13}

    Evento Simples ou Elementar – é aquele que contém apenas um dos

    elementos do espaço amostral. Exemplos: A1, C1, D1, H1.

    Evento Certo – é o próprio espaço amostral S.

    A = S

    Evento Complementar – Dado um evento A de um espaço amostral S,

    define-se o evento complementar de A, como o subconjunto de todos os elementos

    de S que não estão em A, isto é,

    Ā = {x : x ∈ S e /∈ A}

  • 36

    Propriedades

    a) A ∪ Ā = S

    b) A ∩ Ā = ∅

    Exemplo: Em E4 = {1, 2, 3, 4, 5, 6}, podem-se definir os eventos comple-

    mentares

    A: sair face par ⇒ A = {2, 4, 6}

    Ā: sair face ı́mpar ⇒ Ā = {1, 3, 5}.

    Eventos Mutuamente Exclusivos

    Dois eventos A1 e A2 são mutuamente exclusivos, se eles não podem ocorrer

    simultaneamente, isto é, A1∩A2 = ∅. Exemplo: Em E4, podem-se definir os eventos

    mutuamente exclusivos

    A1: sair o número 2, A1 = {2}

    A2: sair número ı́mpar, A2 = {1, 3, 5}

    A1 ∩ A2 = ∅.

    Eventos Independentes

    Dois eventos A1 e A2 são dependentes, se a ocorrência de um deles depende

    de que o outro tenha ocorrido, ou não. Dois eventos A1 e A2 são independentes, se

    a ocorrência de um deles independe de que o outro tenha ocorrido, ou não.

    Exemplo: Seja

  • 37

    E: Retirar 2 bolas de uma urna com 2 bolas brancas e uma preta, sem

    reposição.

    Os eventos

    A1: A primeira bola é branca e

    A2: A segunda bola é branca

    são dependentes, pois a chance de ocorrência da segunda bola branca muda, depen-

    dendo da cor da primeira bola.

    2.2 Definição de Probabilidade

    Dado um espaço amostral S, a probabilidade de um evento A, representada

    por P (A), é uma função definida em S, que associa um valor numérico ao evento A,

    satisfazendo os axiomas:

    a) 0 ≤ P (A) ≤ 1

    b) P (S) = 1

    c) Se A e B são eventos mutuamente exclusivos (A ∩B = ∅), então:

    P (A ∪B) = P (A) + P (B).

    Nos problemas práticos o valor P (A) pode ser obtido por

    P (A) =tamanho de A

    tamanho de S.

    Exemplos

    1) Joga-se um dado. Qual a probabilidade de sair pelo menos 3?

    Solução: Dado que S = {1, 2, 3, 4, 5, 6} e A = {3, 4, 5, 6}, então

    P (A) =4

    6=

    2

    3.

    2) Uma urna contém 5 bolas brancas, 7 pretas e 3 vermelhas. Tiram-se 5

    bolas de uma vez. Calcule as probabilidades dos eventos que se seguem.

    a) Sáırem 3 bolas brancas e 2 vermelhas.

  • 38

    p1 =C35C

    23

    C515=

    10

    1001.

    b) Não sair nenhuma bola branca.

    p2 =C510C515

    =12

    143.

    c) Sair pelo menos uma preta.

    p3 = 1− P (nenhuma bola preta) = 1−C58C515

    =421

    429.

    2.3 Teoremas

    1. Se ∅ é o conjunto vazio, então P (∅) = 0.

    Prova:

    A e ∅ são disjuntos, pois A ∩ ∅ = ∅

    P (A ∪ ∅) = P (A) + P (∅)

    P (A) = P (A) + P (∅), pois A ∪ ∅ = A

    Logo, P (∅) = 0.

    2. Se Ā é o complemento de A, então P (Ā) = 1− P (A).

    Prova:

    Como A ∪ Ā = S e A ∩ Ā = ∅, então

    P (A ∪ Ā) = P (A) + P (Ā) por (c),

    P (S) = P (A) + P (Ā) e por (b)

    1 = P (A) + P (Ā) ⇒ P (Ā) = 1− P (A).

  • 39

    3. Se A ⊂ B,então P (A) ≤ P (B).

    Prova:

    Pelo Diagrama de Venn, B = A ∪ (B ∩ Ā) e, portanto,

    P (B) = P (A) + P (B ∩ Ā) por (c), mas

    P (B ∩ Ā) ≥ 0 por (a), então,

    P (B) ≥ P (A) ou P (A) ≤ P (B).

    4. Se A e B são dois eventos quaisquer, então:

    P (A ∪B) = P (A) + P (B)− P (A ∩B)

    i) Se A e B são mutuamente exclusivos, P (A ∩ B) = 0 e decorre imediata-

    mente pelo axioma (c)

    P (A ∪B) = P (A) + P (B)

    ii) Se A ∩B ̸= ∅

    Pelo diagrama de Venn, A ∪B = A ∪ (Ā ∩B).

    Logo, como A e Ā ∩B são mutuamente exclusivos

    P (A ∪B) = P (A) + P (Ā ∩B), mas

  • 40

    B = (B ∩ A) ∪ (B ∩ Ā).

    Logo, P (B) = P (B∩A)+P (B∩Ā), pois (B∩A) e (B∩Ā) são mutuamente

    exclusivos. Então,

    P (B ∩ Ā) = P (B)− P (B ∩ A) e, portanto,

    P (A ∪B) = P (A) + P (B)− P (B ∩ A).

    5. Se A e B são dois eventos quaisquer, então:

    P (A ∩B) = P (Ā ∪ B̄) e P (A ∪B) = P (Ā ∩ B̄)

    2.4 Espaços amostrais finitos equiprováveis

    Quando a cada ponto amostral de um espaço amostral está associada a

    mesma probabilidade, o espaço amostral chama-se equiprovável ou uniforme. Em

    particular, se S contém n pontos, a probabilidade de cada ponto será igual a1

    n.

    Por outro lado, se um evento A contém r pontos, então,

    P (A) = r1

    n=

    r

    n.

    Esse método de avaliar P (A) é frequentemente colocado da seguinte forma

    P (A) =número de elementos de A

    número de elementos do espaço amostral

    ou

    P (A) =número de casos favoráveis

    número total de casos=

    n(A)

    n(S).

  • 41

    2.5 Probabilidade Condicional, Teorema do Pro-

    duto, Eventos Independentes

    Exemplo inicial: Uma urna contém duas bolas brancas e três bolas verdes.

    Retiram-se duas bolas 1 a 1. Sejam os seguintes eventos:

    A: a primeira bola é branca

    B: a segunda bola é branca

    Considere o experimento:

    1) Com reposição da primeira bola

    P (A) =2

    5e P (B) =

    P (B|A) = 2

    5

    P (B|Ā) = 25

    2) Sem reposição da primeira bola

    P (A) =2

    5e P (B) =

    P (B|A) = 1

    4

    P (B|Ā) = 24=

    1

    2

    Observações:

    i) P (B|A) é a probabilidade de B dado que ocorreu A.

    ii) P (B|Ā) é a probabilidade de B dado que não ocorreu A.

    iii) Note que no primeiro caso (com reposição) a ocorrência do evento B não

    depende de que A tenha, ou não, ocorrido.

    P (B|A) = P (B|Ā) = 25= P (B).

    iv) Note que no segundo caso (sem reposição) a ocorrência do evento B

    depende de que A tenha, ou não, ocorrido.

    P (B|A) = 14̸= P (B|Ā) = 1

    2.

  • 42

    Outro exemplo: Considere o experimento E e os eventos A e B

    E: lançar um dado honesto

    A: ocorrer face par

    B: ocorrer face 2

    Então, sem dúvida P (A) =1

    2e P (B) =

    1

    6.

    Suponha que o dado tenha sido lançado e que já tenha ocorrido face par.

    Nessas condições, qual a probabilidade de ocorrer face 2, isto é, P (B|A) =?

    O espaço amostral S′agora está reduzido de S para A.

    S′= {2, 4, 6} = A

    P (B|A) = n(B)n(S ′)

    =n(B)

    n(A)=

    1

    3.

    Definição: Dados os eventos A e B de um espaço amostral S, define-se a

    probabilidade condicional de B dado que ocorreu A, por

    P (B|A) = P (A ∩B)P (A)

    com P (A) ̸= 0, pois A já ocorreu.

    P (B|A) =

    n(A ∩B)n(S)

    n(A)

    n(S)

    =n(A ∩B)n(A)

    .

    No exemplo, A = {2, 4, 6} e B = {2}, e, portanto,

    A ∩B = {2} ⇒ m(A ∩B) = 1

    m(A) = 3 ⇒ P (B|A) = 13.

    Dessa definição decorre o

    Teorema do Produto: “A probabilidade de ocorrência de dois eventos A

    e B, do mesmo espaço amostral é igual ao produto da probabilidade de um deles

    pela probabilidade condicional do outro, dado o primeiro.”

  • 43

    P (B|A) = P (A ∩B)P (A)

    ⇒ P (A ∩B) = P (A)P (B|A)

    ou

    P (A|B) = P (A ∩B)P (B)

    ⇒ P (A ∩B) = P (B)P (A|B).

    No exemplo da urna, considere o evento

    C: ambas as bolas são brancas.

    Então,

    P (C) = P (A ∩B) = P (A) · P (B|A)

    Note que:

    1) Com reposição da primeira bola

    P (A ∩B) = P (B)P (B|A), em que P (B|A) = P (B)

    P (A ∩B) = P (A) · P (B) = 25· 25=

    4

    25

    2) Sem reposição da segunda bola

    P (B|A) ̸= P (B)

    P (A ∩B) = P (A) · P (B|A) = 25· 14=

    1

    10

    Definição: Um evento A é independente de um evento B se a probabilidade

    de A ocorrer não é influenciada pelo fato de B ter ocorrido, ou não, ou seja, se

    P (A) = P (A|B).

    É evidente que, se A é independente de B, B é independente de A. Assim

    P (B) = P (B|A).

    Considerando o teorema do produto, se A e B são independentes, então

    P (A ∩B) = P (A) · P (B).

    Observação: Dados k eventos A1, A2, ..., Ak diz-se que eles são indepen-

    dentes se eles forem independentes 2 a 2, 3 a 3,..., k a k.

  • 44

    Exemplos:

    1) Em um lote de 12 peças, 4 são defeituosas; 2 peças são retiradas uma

    após a outra, sem reposição. Qual a probabilidade de que ambas sejam boas?

    Solução:

    A: a primeira peça é boa

    B: a segunda peça é boa

    P (A ∩B) = P (A) · P (B|A) = 812

    7

    11=

    14

    33

    2) Em um certo colégio, 25% dos estudantes foram reprovados em

    matemática, 15% em qúımica e 10% em matemática e qúımica ao mesmo tempo,

    isto é,

    P (A) =1

    4, P (B) =

    15

    100=

    3

    20e P (A ∩B) = 1

    10.

    Um estudante é aleatoriamente escolhido.

    a) Se ele foi reprovado em qúımica, qual é a probabilidade de ele ter sido

    reprovado em matemática?

    P (A|B) =

    1

    103

    20

    =2

    3.

    b) Se ele foi reprovado em matemática qual é a probabilidade de ele ter sido

    reprovado em qúımica?

    P (B|A) =

    1

    101

    4

    =4

    10=

    2

    5.

    c) Qual a probabilidade de ele ter sido reprovado em qúımica ou matemática?

    P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0, 25 + 0, 15− 0, 10 = 0, 30.

  • 45

    Um outro exemplo do Teorema da Soma

    Lança-se um dado honesto. Qual a probabilidade de ocorrer

    a) Face menor do que 5 ou face par?

    A = {1, 2, 3, 4} ⇒ P (A) = 46

    B = {2, 4, 6} ⇒ P (B) = 36

    A ∪B = {1, 2, 3, 4, 6}

    A ∩B = {2, 4} ⇒ P (A ∩B) = 26

    P (A ∪B) = P (A) + P (B)− P (A ∩B) = 56

    b) Face menor do que 5 ou face maior que 5?

    A = {1, 2, 3, 4} ⇒ P (A) = 46

    C = {6} ⇒ P (C) = 16

    A ∪ C = {1, 2, 3, 4, 6}

    A ∩ C = ∅ ⇒ P (A ∩ C) = 0

    P (A ∪ C) = 46+

    1

    6=

    5

    6

    c) Face par ou face ı́mpar?

    B = {2, 4, 6} ⇒ P (B) = 36

    D = {1, 3, 5} ⇒ P (D) = 36

    B ∪D = S ⇒ P (S) = 1

    B ∩D = ∅

    P (B ∪D) = 1

  • 46

    2.6 Teorema de Bayes ou das probabilidades co-

    nhecidas “a priori”

    Definição: Sejam A1, A2, ..., An, n eventos mutuamente exclusivos, tais que

    A1 ∪ A2 ∪ ... ∪ An = S

    Sejam P (Ai) as probabilidades conhecidas dos vários eventos e B um evento

    qualquer de S tal que conhecemos todas as probabilidades condicionais P (B|Ai).Então, para cada i, tem-se:

    P (Ai|B) =P (Ai ∩B)

    P (B)=

    P (Ai ∩B)P (A1 ∩B) + ...+ P (An ∩B)

    =P (Ai)P (B|Ai)

    P (A1)P (B|A1) + ...+ P (An)P (B|An)

    Exemplos

    1) Em uma gaiola metálica 4% dos coelhos machos e 1% das fêmeas pesam

    mais do que 1,8 kg. Por outro lado, 60% dos coelhos são fêmeas. Se um coelho

    escolhido aleatoriamente pesa mais de 1,8 kg, qual a probabilidade de ser fêmea?

    Solução:

    Logo, podem-se considerar os eventos:

    A1 : coelho fêmea

    A2 : coelho macho

    B : coelho pesa mais de 1,8 kg

  • 47

    e as probabilidades

    P (A1) = 0, 6, P (B|A1) = 0, 01

    P (A2) = 0, 4, P (B|A2) = 0, 04

    P (A1|B) =0, 6 · 0, 01

    0, 6 · 0, 01 + 0, 4 · 0, 04=

    0, 006

    0, 022=

    3

    11.

    2) Uma cĺınica envia amostras de equinos para 3 laboratórios de análises A,

    B e C nas seguintes proporções 0,2; 0,3 e 0,5, respectivamente. A probabilidade de

    cada um dos laboratórios elaborar uma análise errada é de, respectivamente,1

    2,1

    3e

    1

    6.

    Logo, podem-se considerar os eventos:

    A1 : análise feita pelo laboratório A

    A2 : análise feita pelo laboratório B

    A3 : análise feita pelo laboratório C

    B : realizar uma análise errada

    e as probabilidades

    P (A1) = 0, 2 P (B|A1) =1

    2

    P (A2) = 0, 3 P (B|A2) =1

    3

    P (A3) = 0, 5 P (B|A3) =1

    6.

    a) Uma análise resultou errada, qual a probabilidade de ter sido feita pelo

    laboratório A? Pelo B? Pelo C?

    P (A1|B) =0, 2 · 1

    2

    0, 2 · 12+ 0, 3 · 1

    3+ 0, 5 · 1

    6

    =0, 11, 7

    6

    = 0, 3529

    P (A2|B) = 0, 3529 P (A3|B) = 0, 2941

    b) Qual a probabilidade de um exame executado resultar errado?

  • 48

    P (B) = P (A ∩B1) + P (A ∩B2) + P (A ∩B3)

    = P (A1) · P (B|A1) + P (A2) · P (B|A2) + P (A3) · P (B|A3) =1, 7

    6= 0, 2833.

    3) Uma urna A contém 1 bola preta e 1 vermelha. Uma urna B contém 2

    bolas pretas e 3 vermelhas. Uma bola é escolhida ao acaso na urna A e colocada na

    urna B. Uma bola é, então, extráıda, ao acaso, da urna B. Qual a probablidade de

    que a primeira bola seja vermelha, sabendo-se que a segunda foi preta?

    Solução:

    Sejam os eventos e as respectivas probabilidades

    A1 : a bola de A para B foi preta ∴ P (A1) =1

    2

    A2 : a bola de A para B foi vermelha ∴ P (A2) =1

    2

    X: a bola tirada de B é preta

    ∴ P (X|A1) =3

    6=

    1

    2e P (X|A2) =

    2

    6.

    Logo,

    P (A2|X) =

    1

    2· 26

    1

    2· 26+

    1

    2· 36

    =2

    5.

    4) O caráter pescoço pelado das galinhas é dado por um fator genético

    dominante Na. Um animal de constituição genética NaNa ou Nana, tem pescoço

    pelado, mas terá pescoço coberto se tiver a constituição nana. Tendo um galo

    de pescoço pelado sido cruzado com galinhas de pescoço coberto, foram obtidos 5

    pintos, todos de pescoço pelado. Qual a probabilidade de que o galo seja puro para

    o fator Na?

  • 49

    Solução:

    Sejam os eventos:

    A1 : galo puro NaNa

    A2 : galo de constituição genética Nana

    B : 5 pintos Nana

    e as probabilidades

    P (A1) =1

    2, P (B|A1) = 1

    P (A2) =1

    2, P (B|A2) =

    (1

    2

    )5.

    Logo,

    P (A1|B) =

    1

    2· 1

    1

    2· 1 + 1

    2· 132

    =32

    33= 0, 97.

    2.7 Exerćıcios

    1) Considere o experimento E: Lançar um dado e uma moeda. Pede-se:

    a) Construa o espaço amostral

    b) Enumere os seguintes eventos

    A = {coroa, marcado por número ı́mpar}

    B = {cara, marcado por número ı́mpar}

    C = {múltiplos de 3}

    c) Expresse os eventos

    I) B

    II) A ou B ocorrerem

    III) B e C ocorrerem

    IV) A∪B

    d) Quais dos eventos A, B e C são mutuamente exclusivos?

  • 50

    2) Determine a probabilidade de:

    a) Sair um número par no lançamento de um dado não-viciado.

    b) Sair um rei ao se extrair uma carta de um baralho.

    c) Sair soma 5 no lançamento de dois dados.

    3) Um grupo de 15 elementos apresenta a seguinte composição:

    Homens Mulheres

    Menores 5 3

    Adultos 5 2

    Um elemento é escolhido ao acaso. Pergunta-se:

    a) Qual a probabilidade de ser homem?

    b) Qual a probabilidade de ser adulto?

    c) Qual a probabilidade de ser menor e mulher?

    d) Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de ser

    homem?

    e) Dado que a escolha é mulher, qual a probabilidade de ser menor?

    4) Considere que existam numa população animais de genótipos dos tipos

    BB, Bb e bb, sendo os indiv́ıduos BB e Bb pretos e os do tipo bb brancos. As

    probabilidades dos 6 tipos de acasalamento estão resumidas na tabela a seguir:

    BB Bb bb

    BB4

    25

    5

    25

    6

    25

    Bb -3

    25

    4

    25

    bb - -3

    25

  • 51

    Dado que um descendente é branco, quais as probabilidades dos diversos

    cruzamentos?

    5) Denomina-se “screening program” a avaliação total de uma população

    sobre determinada doença. Para se ter essa avaliação, cada indiv́ıduo é submetido

    ao mesmo teste cĺınico. Em um destes programas foram apurados os resultados que

    se seguem:

    Doença Positivo (A) Negativo (B) Total

    Presente (B) 950 50 1000

    Ausente (B) 10 990 1000

    Total 960 1040 2000

    Calcular as probabilidades condicionais apropriadas e responder se este teste

    cĺınico é apropriado e se o programa deve ou não ser executado.

    Informa-se que:

    a) P (A|B): quanto maior, mais senśıvel será o teste

    b) P (A|B): quanto menor, mais espećıfico será o teste

    c) P (B|A): falsos positivos

    d) P (B|A): falsos negativos

    Observação: Por (a) e (b) ter-se-á a resposta à primeira pergunta e por (c)

    e (d) a resposta à segunda pergunta.

    Num laboratório, após um experimento com reação em cadeia de polimerase

    (PCR), foram obtidos dez tubos de ensaio, numerados de 1 a 10. Sabe-se que em

    três deles a reação não ocorreu como o esperado.

    1) Considerando o experimento com reposição, e os evendos:

    A = o primeiro tubo contém reação que não ocorreu como o esperado

    B = o segundo tubo contém reação que não ocorreu como o esperado

  • 52

    1.1. A e B são independentes?

    1.2. A e B são mutuamente exclusivos?

    1.2. Determine P (A), P (B), P (A∩B) e P (A

    ∪B)

    2) Refaça o item (1) considerando o experimento com reposição.

  • Caṕıtulo 3

    Variáveis Aleatórias3.1 Definição

    Define-se uma variável aleatória como uma função X, que associa a cada ele-

    mento s ∈ S um número real X(s), ou seja, associa valores numéricos aos resultados

    de um experimento.

    Exemplo 1:

    E: lançamento de duas moedas

    X: números de caras obtidos nas duas moedas

    S = {(c, c); (c, k); (k, c); (k, k)}

    X = {0, 1, 2}

    53

  • 54

    Assim, uma variável aleatória tem domı́nio em S e contradomı́nio em ℜ.

    Uma variável aleatória pode ser: discreta ou cont́ınua. Será discreta se o número

    posśıvel de valores de X (seu contradomı́nio) for finito ou infinito numerável. Será

    cont́ınua se o seu contradomı́nio for um intervalo ou uma coleção de intervalos. No

    exemplo, X é uma variável discreta.

    3.2 Variáveis Aleatórias Discretas

    3.2.1 Função de Probabilidade

    A probabilidade de que a variável aleatória X assuma o valor x, é a função

    de probabilidade de X representada por P (X = x) ou simplesmente P (x). A função

    P (X = x) determina a distribuição de probabilidades da variável aleatória e deve

    satisfazer os axiomas:

    a) 0 6 P (xi) 6 1b)∑

    i P (xi) = 1

    No exemplo 1, tem-se a distribuição de probabilidade de X:

    X = x 0 1 2

    P(X = x) 14

    12

    14

    Graficamente

    x

    P(x)

    0 1 2

    1/41/2

    Exemplo 2:

    E2 : lançar dois dados e observar a soma dos números obtidos.

    X = x 2 3 4 5 6 7 8 9 10 11 12

    P(X = x) 136

    236

    336

    436

    536

    636

    536

    436

    336

    236

    136

  • 55

    Graficamente

    x

    P(x)

    2 3 4 5 6 7 8 9 10 11 12

    1/36

    2/36

    3/36

    4/36

    5/36

    6/36

    3.2.2 Função de Distribuição Acumulada

    Define-se Função de Distribuição Acumulada da variável aleatória X, no

    ponto x, como sendo a probabilidade de que X assuma um valor menor do que ou

    igual a x, isto é,

    F (x) = P (X 6 x)

    Propriedades:

    a) F (x) =∑

    xi6x P (xi)

    b) F (−∞) = 0

    c) F (∞) = 1

    d) P (a < X 6 b) = F (b)− F (a)e) P (a 6 X 6 b) = F (b)− F (a) + F (X = a)f) P (a < X < b) = F (b)− F (a)− F (X = b)

    No exemplo 1:

    X = x 0 1 2

    P(X = x) 14

    12

    14

    F(x) 14

    341

    Exemplo 3:

    E3: lançar um dado e observar o número da face superior

    X = x 1 2 3 4 5 6

    P(X = x) 16

    16

    16

    16

    16

    16

    F(x) 16

    26

    36

    46

    56

    66

  • 56

    x

    F(x)

    1 2

    1/43/4

    1

    x

    P(x)

    1 2 3 4 5 6

    1/6

    x

    F(x)

    1 2 3 4 5 6

    1/62/6

    3/64/6

    5/61

    3.3 Variável Aleatória Cont́ınua

    Função Densidade de Probabilidade

    Seja X uma v.a. cont́ınua. A função densidade de probabilidade f(x) é uma

    função que satisfaz às seguintes condições:

    a) f(x) ≥ 0

    b)∫Rf(x)dx = 1

    Além disso,

    P (a < X < b) =∫ baf(x)dx

    Propriedades:

    a) P (X = x0) =∫ x0x0

    f(x)dx = 0

    b)

    P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b)

    =

    ∫ ba

    f(x)dx

  • 57

    Verifica-se que f(x), densidade de probabilidade, não é probabilidade.

    Somente quando a função for integrada entre dois limites, ela produzirá uma

    probabilidade que será a área sob a curva da função entre x = a e x = b, para a < b.

    Exemplo 4

    Seja X uma v.a.c. com função densidade de probabilidade (f.d.p)

    f(x) =

    2x se 0 < x < 10 para outros valoresf(x) é f.d.p., pois

    a) f(x) ≥ 0

    b)∫∞−∞ f(x)dx =

    ∫ 102xdx = [x2]10 = 1

    Exemplo 5

    Uma v.a. tem a seguinte função densidade de probabilidade

    f(x) =

    0 se x < 0

    kx2 se 0 < x < 1

    0 se x ≥ 1

    Pede-se:

    a) Determinar k

    b) Fazer o gráfico de f(x)

    c) Obter P (0 < X < 12)

    Solução:

    a)

    k

    ∫ 10

    x2dx = k

    [x3

    3

    ]10

    =k

    3= 1 ⇒ k = 3

    ∴ f(x) = 3x2 para 0 < x < 1

  • 58

    b)

    c)

    P (0 < X <1

    2) = 3

    ∫ 12

    0

    x2dx = 3

    [x3

    3

    ]1/20

    =

    [1

    2

    ]3=

    1

    8

    3.4 Parâmetros

    De uma maneira geral, as distribuições teóricas podem ser caracterizadas

    por parâmetros análogos àqueles da estat́ıstica descritiva.

    3.4.1 Esperança Matemática, Valor Esperado ou Média de

    uma variável aleatória

    Define-se esperança matemática de uma v.a.d. X, como

    µx = E(X) = ΣxiP (xi)

    e de uma v.a.c., como

    µx = E(X) =

    ∫ ∞−∞

    xf(x)dx.

    Exemplo 6:

    E1: lançar duas moedas

    X: número de caras

    xi 0 1 2

    P (xi)1

    4

    1

    2

    1

    4

    µx = 0 ·1

    4+ 1 · 1

    2+ 2 · 1

    4= 1

    Espera-se que para um número grande de jogadas ocorra em média uma

    cara.

    Exemplo 7:

    E1: lançar dois dados

  • 59

    X: soma dos números mostrados na face de cima

    xi 2 3 4 5 6 7 8 9 10 11 12

    P (xi)1

    36

    2

    36

    3

    36

    4

    36

    5

    36

    6

    36

    5

    36

    4

    36

    3

    36

    2

    36

    1

    36

    µx =1

    36[2 + 6 + 12 + 20 + 30 + 42 + 40 + 36 + 30 + 22 + 12] =

    252

    36= 7

    Exemplo 8:

    f(x) =

    2x, para 0 < x < 10, para outros valoresµx = E(X) =

    ∫ 102x2dx =

    [2x3

    3

    ]10

    =2

    3

    Exemplo 9:

    f(x) =

    3x2, para 0 < x < 10, para outros valoresµx = E(X) =

    ∫ 103x3dx =

    [3x4

    4

    ]10

    =3

    4

    Propriedades da Média (Esperança):

    1. A média de uma constante é a própria constante.

    E(K) =∑i

    KP (xi) = K∑

    P (xi) = K

    E(K) =

    ∫ ∞−∞

    Kf(x)dx = K

    ∫ ∞−∞

    f(x)dx = K

    2. Multiplicando-se uma v.a. X por uma constante, sua média fica multipli-

    cada por essa constante.

    E(KX) =∑

    KxiP (xi) = K∑

    xiP (xi) = KE(X)

    E(KX) =

    ∫ ∞−∞

    Kxf(x)dx = K

    ∫ ∞−∞

    xf(x)dx = KE(X)

  • 60

    3. E(X ± Y ) = E(X)± E(Y )

    4. E(X ±K) = E(X)±K

    5. E(X − µx) = E(X)− µx = 0

    6. E(XY ) = E(X) · E(Y ) se X e Y forem independentes

    3.4.2 Variância

    Define-se variância de uma v.a., como:

    σ2x = Var(X) = E[X − E(X)]2

    logo

    σ2x = Var(X) = Σ(xi − µx)2P (xi) se X v.a.d.

    e

    σ2x = Var(X) =

    ∫ ∞−∞

    (x− µx)2f(x)dx se X v.a.c.

    Exemplo 10:

    E: Lançar duas moedas

    X: Número de caras

    E(X) = 1

    Var(X) = (0− 1)2 · 14+ (1− 1)2 · 1

    2+ (2− 1)2 · 1

    4= 1

    2

    Exemplo 11:

    f(x) =

    2x, para 0 < x < 10, para outros valores

  • 61

    E(X) = 23

    Var(X) = 2

    ∫ 10

    (x− 2

    3

    )2xdx = 2

    ∫ 10

    (x2 − 4

    3x+

    4

    9

    )xdx = 2

    ∫ 10

    (x3 − 4

    3x2 +

    4

    9x

    )dx

    = 2

    (x4

    4− 4

    3· x

    3

    3+

    4

    9· x

    2

    2

    )10

    = 2

    (1

    4− 4

    9+

    4

    18

    )= 2

    (9− 16 + 8

    36

    )=

    1

    18

    Propriedades da Variância:

    1) A variância de uma constante é zero.

    Var(K) = E{(K − E(K))2} = E[K −K] = 0

    2) Multiplicando-se uma v.a por uma constante, sua variância fica multipli-

    cada pelo quadrado da constante.

    Var(KX) = E{[KX − E(KX)]2} = K2E{X − E(X)}2 = K2Var(X)

    3) Somando-se ou subtraindo-se uma constante K a uma v.a., sua variância

    não se altera.

    Var(X ±K) = E{[(X ±K)− E(X ±K)]2} = E{[X ±K − E(X)±K]2}

    = E{[X − E(X)]2} = Var(X)

    4) Var(X) = E{[X − E(X)]2} = E{X2 − 2XE(X) + [E(X)]2}

    = E(X2)− 2[E(X)]2 + [E(X)]2 = E(X2)− [E(X)]2

    Obs.: Em muitos casos essa propriedade facilita grandemente o cálculo da

    variância.

    Exerćıcios

  • 62

    1) Seja X uma v.a.c. com f.d.p

    f(x) =

    k(x+ 3), para 1 ≤ x ≤ 80, para outros valores de xPede-se:

    a) Determinar k

    b) P (2 < X < 6)

    c) P (X ≤ 3)

    d) P (X ≥ 3)

    e) E(X)

    f) E(X2)

    g) σ2x

    2) Considere a distribuição de probabilidade da v.a.d. X, em que X= número

    de pontos obtidos quando se lança um dado uma só vez. Pede-se:

    a) Gráfico da função de probabilidade

    b) E(X) = µx

    c) E(X2)

    d) σ2x = E(X2)− [E(X)]2

    3) Sejam as variáveis aleatórias discretas:

    X = número de tubos cuja reação não ocorreu como o esperado na amostra

    escolhida

    Y = número de tubos cuja reação ocorreu com sucesso na amostra escolhida

    3.1. Determine as distribuições de probabilidade de X e Y, considerando o experi-

    mento com reposição e, em seguida, sem reposição.

    3.2. Compare E[X] nos casos com e sem reposição.

    3.3. Idem (3.2) para E[Y ], Var[X] e Var[Y ].

  • 63

    3.4. Compare E[X] + E[Y ] com o tamanho da amostra retirada. (n = 2)

    4) Sabendo-se que sob certas condições, o ciclo vital da praga A, que atua

    na cana-de-açúcar, pode ser descrito por:

    f(x) =

    6(x− x2), se x ∈ [0; 1]0, caso contrário4.1. Verifique se f(x) pode ser estudada como uma função densidade de probabili-

    dades.

    4.2. Esboce um gráfico para f(x).

    4.3. Determine E[X] e Var[X].

    4.4. Determine e identifique no gráfico da função: a) P (0 < x < 1/4)

    b) P (1/4 < x < 3/4)

    c) P (x > 3/4).

  • Caṕıtulo 4

    Distribuições de probabilidade

    4.1 Definição

    Entre as variáveis aleatórias existem algumas que se destacam por sua im-

    portância quanto à representatividade de grande parte de fenômenos biológicos.

    Assim, por exemplo, sabe-se que variáveis como peso, altura, idade, etc têm

    distribuição normal de probabilidade enquanto que o número de sementes germi-

    nadas pode ter distribuição binomial; o número de insetos presos em uma armadilha

    luminosa e o número de reações nocivas motivadas pela injeção de certo soro podem

    ter a distribuição de Poisson.

    São estudadas, a seguir, algumas distribuições de v.a. mais utilizadas. Den-

    tre as v.a.d., serão vistas:

    - Distribuição de Bernoulli

    - Distribuição Binomial

    - Distribuição Poisson

    Dentre as de v.a.c, podem ser consideradas:

    - Distribuição Normal

    - Distribuição de χ2-quadrado

    - Distribuição t de Student

    - Distribuição F de Snedecor

    65

  • 66

    4.2 Distribuição de Bernoulli

    4.2.1 Definição

    Um experimento de Bernoulli é aquele ao qual podem ser associados apenas

    dois resultados: sucesso (se acontecer o evento de interesse) ou fracasso (se não

    acontecer o evento de interesse). Tem-se, então, uma v.a.d. X que assume valor 1

    caso ocorra o evento A (sucesso) e o valor 0 caso não ocorra (insucesso ou fracasso),

    com probabilidades, respectivamente, p = P (X = 1) e q = 1 − p = P (X = 0), isto

    é, a distribuição de probabilidade de X é

    X = x x1 = 0 x2 = 1

    P (X = x) q = 1− p p

    sendo que q + p = 1− p− p = 1.

    Exemplos:

    E1: Planta-se uma semente de feijão

    A: a semente germina com probabilidade p

    Ā: a semente não germina com probabilidade 1− p

    E2: Lança-se um dado honesto e observa-se o valor da face voltada para

    cima

    A: virar face 3, x2 = 1 e P(X = x2) =1

    6

    Ā: virar face diferente de 3, x1 = 0 e P(X = x1) =5

    6.

    Observa-se que no experimento E1 a probabilidade “p” não é conhecida “a

    priori”. Em alguns casos desse tipo, obtêm-se informações sobre estimativas de “p”

    em revisões de bibliografia ou estima-se “p” experimentalmente.

    4.2.2 Média, Variância e Desvio-Padrão

    São obtidos por

  • 67

    µx = µ = E(X) = Σ2i=1xiP (xi) = 0 · q + 1 · p = p

    σ2 = Var(X) = E[X − E(X)]2 = E(X2)− [E(X)]2

    E(X2) = Σ2i=1x2iP (xi) = 0

    2 · q + 12 · p = p

    σ2 = p− p2 = p(1− p) = p · q

    σx =√

    σ2x =√pq.

    Em E2 tem-se

    µx = 0.5

    6+ 1.

    1

    6=

    1

    6

    σ2x =

    (0− 1

    6

    )2.5

    6+

    (1− 1

    6

    )2.1

    6=

    1

    6

    (1− 1

    6

    )2=

    5

    36

    σx =

    √5

    36=

    √5

    6

    4.3 Distribuição Binomial

    4.3.1 Definição

    Seja uma sequência de n ensaios independentes e repetidos de Bernoulli.

    Então se a v.a. X representa o número de sucessos nesses n ensaios, diz-se que X

    tem distribuição binomial de probabilidades com parâmetros n e p e com função de

    probabilidade dada por:

    P (X = x) = Cxnpxqn−x

    Vê-se que P (X = x) é f.d.p., pois

    a) P (X = x) ≥ 0,∀x

    b)∑

    P (X = x) =n∑

    x=0

    Cxnpxqn−x = C0np

    0qn + C1np1qn−1 + . . .+ Cnnp

    nq0

    = (p+ q)n = 1

    Exemplo:

    Um recipiente contém um grande número de sementes de feijão para as

    quais o fornecedor garante um poder de germinação de 0,8. Se 5 dessas sementes são

    plantadas, determine:

  • 68

    a) A distribuição de probabilidades para a variável

    X: números de sementes germinadas.

    Distribuição de Probabilidade de X

    X = xi P (X = xi) P (X = xi)

    0 0,00032 P (0) = C50 (0, 8)0(0, 2)5

    1 0,00640 P (1) = C51 (0, 8)1(0, 2)4

    2 0,05120 P (2) = C52 (0, 8)2(0, 2)3

    3 0,20480 P (3) = C53 (0, 8)3(0, 2)2

    4 0,40960 P (4) = C54 (0, 8)4(0, 2)1

    5 0,32768 P (5) = C55 (0, 8)5(0, 2)0

    b) A probabilidade de que germinem no máximo 4 sementes.

    P [X ≤ 4] = P (0) + P (1) + P (2) + P (3) + P (4) = 0, 67232 ou

    P [X ≤ 4] = 1− P (X = 5) = 1− 0, 32768 = 0, 67232.

    4.3.2 Média, Variância e Desvio-Padrão

    Como X v.a.d. binomial nada mais é do que a soma de n variáveis indepen-

    dentes do tipo Bernoulli, tem-se:

    µx = µ = E(X) = ΣxP (X = x) = np

    σ2 = E[X − E(X)]2 = E(X2)− [E(X)]2 = npq

    σx =√

    σ2x =√npq

    No exemplo dado

    µx = 5 · 0, 8 = 4 germinações

    σ2x = 5 · 0, 8 · 0, 2 = 0, 8 germinações ao quadrado

    σx =√0, 8 = 0, 894 germinações.

  • 69

    No mesmo exemplo, ainda suponha que o agricultor precisa obter 100 mudas.

    Qual o número mı́nimo de sementes que ele deve plantar? Qual a variabilidade do

    número de sementes germinadas?

    µ = np ⇒ 100 = n · 0, 8 ⇒ n = 125

    σ2x = npq = 125 · 0, 8 · 0, 2 = 20

    σx = 4, 47 ≃ 5

    Exerćıcios

    1) Certo tratamento quando aplicado a bovinos com certa enfermidade cura

    60% dos casos. Tendo dois bovinos sob esse tratamento, qual a probabilidade:

    a) de que os dois morram

    b) de que os dois sejam curados

    c) de que um seja curado e o outro não.

    Qual o número médio de curas e qual sua variabilidade?

    Distribuição de Probabilidade de X

    X = xi 0 1 2

    P (X = xi) 0,16 0,48 0,36

    em que X: número de sobreviventes, p = 0, 6, q = 1− 0, 6 = 0, 4 e n = 2.

    Solução:

    a) P (X = 0) = C02 (0, 6)0(0, 4)2 = 0, 16

    b) P (X = 2) = C22 (0, 6)2(0, 4)1 = 0, 48

    c) P (X = 1) = C12 (0, 6)1(0, 4)1 = 0, 36

    µ = np = 2 · 0, 6 = 1, 2 curas

    σ2 = npq = 2 · 0, 6 · 0, 4 = 0, 48 curas2

    σ =√0, 48 = 0, 6928 curas.

  • 70

    2) Certa doença dada em pintos tem uma fatalidade de 30%. Em 6 casos

    dessa doença, estabeleça a distribuição de probabilidade da v.a

    X: número de sobreviventes

    Baseado nessa distribuição, calcule:

    a) a probabilidade de que todos sobrevivam

    b) a probabilidade de que nenhum sobreviva

    c) a probabilidade de que os dois sobrevivam

    d) a probabilidade de que pelo menos dois sobrevivam

    e) a probabilidade de que no mı́nimo quatro morram

    f) o número médio de sobreviventes

    g) a variância e o desvio-padrão do número de sobreviventes.

    h) Se um produtor de frangos quer obter no final de um determinado peŕıodo

    150 frangos, baseado na incidência dessa doença, qual o número mı́nimo de pintos

    que ele deve comprar? Qual a variabilidade desse número?

    Distribuição de Probabilidade de X

    X = xi 0 1 2 3 4 5 6

    P (X = xi) 0,00073 0,01021 0,05954 0,18522 0,32414 0,30253 0,11764

    p = 0, 7 q = 0, 3 n = 6

    Solução:

    a) P (X = 6) = 0, 11764

    b) P (X = 0) = 0, 00073

    c) P (X = 2) = 0, 05954

    d) P (X ≥ 2) = 1− P (X = 0)− P (X = 1) = 0, 98906

    e) P (X ≤ 2) = P (X = 0) + P (X = 1) + P (X = 2) = 0, 07048

    f) µ = np = 6 · 0, 7 = 4, 2

    g) σ2 = npq = 6 · 0, 7 · 0, 3 = 1, 26 σ =√1, 26 = 1, 12

    h) 150 = n · 0, 7 ⇒ n = 214 frangos

    σ2 = npq = 214 · 0, 7 · 0, 3 = 45 ⇒ σ = 6, 7.

  • 71

    4.4 Distribuição de Poisson

    4.4.1 Definição

    Existem experimentos, nos quais o número de sucessos é conhecido ou facil-

    mente determinável mas o número de insucessos não pode ser determinado. É o que

    acontece quando se tem interesse no número de insetos presos em uma armadilha

    luminosa ou no número de ácaros que atacam determinada cultura ou no número de

    brotos por explante.

    SeX é a variável aleatória discreta tal que sua distribuição de probabilidades

    é do tipo

    P (X = x) =λxe−λ

    x!, x = 0, 1, 2, . . . , λ > 0

    então, X tem distribuição de Poisson com parâmetro λ (λ é o número médio de

    sucessos). Verifica-se que P (X = x) representa uma leǵıtima distribuição de proba-

    bilidade, pois:

    a) P (X = x) ≥ 0, ∀x

    b)∑∞

    x=0

    λxe−λ

    x!= e−λ

    ∞∑x=0

    λx

    x!= e−λ

    [1+

    1

    1!λ+

    1

    2!λ2+

    1

    3!λ3+. . .

    ]= e−λeλ = 1.

    4.4.2 Média, Variância e Desvio-padrão

    São obtidos por:

    µX = E(X) =∞∑x=0

    xλxe−λ

    x!= e−λ

    ∞∑x=1

    xλx−1λ

    x(x− 1)!= e−λ

    ∞∑x=1

    λx−1

    (x− 1)!.λ = e−λ.eλ.λ = λ

    σ2X = E(X2)− [E(X)]2

    E(X2) =∞∑x=0

    x2e−λλx

    x!=

    ∞∑x=1

    x2e−λλx

    x!=

    ∞∑x=1

    xe−λλx

    (x− 1)!=

    ∞∑x=1

    (x− 1 + 1) e−λλx

    (x− 1)!

    =∞∑x=1

    e−λλx

    (x− 1)!+

    ∞∑x=1

    (x− 1) e−λλx

    (x− 1)!= λ+

    ∞∑x=2

    xe−λλx

    (x− 2)!= λ+ λ2

    σ2X = λ+ λ2 − λ2 = λ

    σX =√

    σ2X =√λ.

  • 72

    Exemplo:

    Em um determinado hospital veterinário existem em média 3 diagnósticos

    de cães raivosos. Qual a probabilidade de que ocorram 2 diagnósticos no próximo

    mês?

    P (X = 2) =32.e−3

    2!= 0, 2240.

    4.4.3 Relação entre as distribuições Binomial e de Poisson

    Na distribuição Binomial se n é grande, mas a probabilidade p de ocorrência

    de um evento é proxima de zero, de modo que q = 1− p, é próximo de 1, o evento se

    diz um evento raro. Na prática, considera-se como raro um evento em que o número

    de provas é no mı́nimo 50 e np é menor do que 5. Em tais casos, a distribuição

    binomial é muito bem aproximada pela distribuição de Poisson com λ = np. Tal

    resultado já era de se esperar pois, fazendo λ = npn tem-se pn =λ

    ne se λ é pequeno

    e n tende para infinito, então, p → 0 e q → 1.

    Considerando-se a função de distribuição de probabilidade da variável

    aleatória discreta X binomial

    P (X = x) = Cxnpxqn−x =

    n!

    x!(n− x)!px(1− p)n−x

    =n(n− 1)(n− 2) . . . (n− x+ 1)

    x!px(1− p)n−x

    e, fazendo-se p =λ

    n, tem-se:

    P (X = x) =n(n− 1)(n− 2) . . . (n− x+ 1)

    x!

    n

    )x(1− λ

    n

    )n−x=

    n(n− 1)(n− 2) . . . (n− x+ 1)nx

    λx

    x!

    (1− λ

    n

    )n(1− λ

    n

    )−x= 1

    (1− 1

    n

    )(1− 2

    n

    ). . .

    (1− x− 1

    n

    )λx

    x!

    (1− λ

    n

    )n(1− λ

    n

    )−xQuando n → ∞, enquanto x e λ permanecem constantes, tem-se:

    limn→∞ 1

    (1− 1

    n

    )(1− 2

    n

    ). . .

    (1− x− 1

    n

    )= 1,

  • 73

    limn→∞

    (1− λ

    x

    )n= 1 e limn→∞

    (1− λ

    n

    )n= e−λ.

    Portanto, sob as condições limites dadas, tem-se:

    B(X;n, p) ⇒ e−λλx

    x!,

    para X = 0, 1, 2, . . ., isto é,

    limn→∞

    P (x = x) =e−λλx

    x!

    que é a função densidade de probabilidade de uma variável aleatória discreta com

    distribuição de Poisson.

    Exemplo:

    A probabilidade de um indiv́ıduo sofrer uma reação nociva resultante da

    aplicação de uma determinada vacina é 0,001. Determinar a probabilidade de entre

    2000 indiv́ıduos:

    a)Nenhum sofrer reação

    b) Mais do que 2 sofrerem a reação

    Solução

    a) Por Poisson

    λ = np = 2000.0, 001 = 2

    P (X = 0) = e−220

    0!=

    1

    e2= 0, 1353

    Pela Binomial

    P (X = 0) = C02000(0, 001)0(0.999)2000 = 0, 1353

    b) Por Poisson

    P (X > 2) = 1− e−220

    0!− e−22

    1

    1!− e−22

    2

    2!

    = 1− 0, 1353− 0, 2706 = 0, 3235

    Pela Binomial

  • 74

    P (X = 1) = C12000(0, 001)1(0.999)1999 = 0, 2707

    P (X = 2) = C22000(0, 001)1(0.999)1998 = 0, 2708

    P (X > 2) = 1− 0, 1352− 0, 2707− 0, 2708 = 0, 3233.

    4.5 Distribuição Normal

    4.5.1 Introdução

    A distribuição normal tem sido considerada como a mais importante das

    distribuições de variável aleatória cont́ınua e, é básica para o desenvolvimento de

    testes estat́ısticos tais como, o teste “t”, o teste “F” e o teste “χ2” e outros.

    Dentro do campo de Ciências são consideradas variáveis normalmente dis-

    tribúıdas as variáveis: altura, peso, idade, produção, total de leite, quantidade de

    ração consumida, diâmetro à altura do peito, biomassa, etc.

    A equação matemática da curva normal foi desenvolvida por De Moivre em

    1773 e, posteriormente, Gauss (1775-1855) também obteve a equação de um estudo

    de erros em medidas repetidas da mesma variável, e devido a ele, ela é chamada

    também distribuição de Gauss.

    4.5.2 Definição

    Uma variável aleatória cont́ınua X tem distribuição normal se sua função

    densidade de probabilidade for dada por:

    f(x) =1

    σ√2π

    e−(x− µ)2

    2σ2 ,−∞ < x < ∞

    em que µ e σ são parâmetros que devem satisfazer às condições −∞ < x < ∞ e

    σ > 0. Além disso, será provado que µ e σ correspondem, respectivamente, à média

    e ao desvio-padrão da distribuição, e então, representa-se X ∼ N(µ, σ2).

    Como f(x) é uma função densidade de probabilidade, então,

    a)f(x) ≥ 0, ∀x, pois 1σ√2π

    > 0 e e−(x− µ)2

    2σ2 > 0

  • 75

    b)∫∞−∞ f(x)dx = 1

    Prova: ∫ ∞−∞

    f(x)dx =1

    σ√2π

    ∫ ∞−∞

    e−(x− µ)2

    2σ2 dx,

    fazendo-sex− µσ

    = z ⇒ dx = σdz, quando x → ∞ ⇒ z → ∞ e x → −∞ ⇒ z →

    −∞.

    Logo,

    ∫ ∞−∞

    f(x)dx =1

    σ√2π

    ∫ ∞−∞

    e−z2

    2 σdz =1√2π

    ∫ ∞−∞

    e−z2

    2 dz

    e como g(z) = e−z2

    2 é uma função par, pois g(z) = g(−z),

    tem-se: ∫ ∞−∞

    f(x)dx =1√2π

    2

    ∫ ∞0

    e−z2

    2 dz.

    Fazendo-sez2

    2= t ⇒ 2zdz

    2= dt ⇒ dz = t

    −1/2√2dt, quando z = 0 ⇒ t = 0 e

    z → ∞ ⇒ t → ∞.

    Logo,∫ ∞−∞

    f(x)dx =1√2π

    2√2

    ∫ ∞0

    t−1/2e−tdt =1√π

    ∫ ∞0

    t−1/2e−tdt =1√πΓ(

    1

    2) =

    1√π

    √π = 1

    pois Γ(α+ 1) =∫∞0

    xαe−xdx. Portanto,∫ ∞−∞

    f(x)dx = 1.

    4.5.3 Parâmetros: média, variância e desvio-padrão

    Se X é uma v.a.c. com distribuição normal de parâmetros µ e σ, isto é,

    X ∼ N(µ, σ2)