A Tabela de Distribuição Normal, Explicada

#08 - Distribuição t-Student - Conceitos e Tabela (Setembro 2024)

#08 - Distribuição t-Student - Conceitos e Tabela (Setembro 2024)
A Tabela de Distribuição Normal, Explicada
Anonim

A fórmula de distribuição normal é baseada em dois parâmetros simples - média e desvio padrão - que quantificam a características de um determinado conjunto de dados. Enquanto a média indica o valor "central" ou médio de todo o conjunto de dados, o desvio padrão indica o "spread" ou a variação dos pontos de dados em torno desse valor médio.

Considere os seguintes 2 conjuntos de dados:

Conjunto de dados 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}

Conjunto de dados 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Para Dataset1, significa = 10 e desvio padrão (stddev) = 0

Para Dataset2, significa = 10 e desvio padrão (stddev) = 2. 83

Vamos traçar esses valores para DataSet1:

Similarmente para DataSet2:

A linha horizontal vermelha nos dois gráficos acima indica o valor "médio" ou médio de cada conjunto de dados (10 em ambos os casos). As setas rosa no segundo gráfico indicam a propagação ou variação de valores de dados a partir do valor médio. Isso é representado pelo valor de desvio padrão de 2. 83 no caso de DataSet2. Uma vez que DataSet1 tem todos os valores iguais (como 10 cada) e sem variações, o valor stddev é zero e, portanto, não há setas rosa aplicáveis.

O valor stddev possui algumas características significativas e úteis que são extremamente úteis na análise de dados. Para uma distribuição normal, os valores de dados são distribuídos simetricamente em ambos os lados da média. Para qualquer conjunto de dados normalmente distribuído, trace o gráfico com stddev no eixo horizontal e não. de valores de dados no eixo vertical, obtém-se o seguinte gráfico.

Propriedades de uma distribuição normal

  1. A curva normal é simétrica sobre a média;
  2. A média está no meio e divide a área em duas metades;
  3. A área total abaixo da curva é igual a 1 para a média = 0 e stdev = 1;
  4. A distribuição é completamente descrita por sua média e stddev

Como pode ser visto a partir do gráfico acima, stddev representa o seguinte:

  • 68. 3% de valores de dados estão dentro de 1 desvio padrão da média (-1 a +1)
  • 95. 4% de valores de dados estão dentro de 2 desvios padrão da média (-2 a +2)
  • 99. 7% de valores de dados estão dentro de 3 desvios padrão da média (-3 a +3)

A área sob a curva em forma de sino, quando medida, indica a probabilidade desejada de um dado faixa

  • inferior a X: - e. g. a probabilidade de os valores de dados serem inferiores a 70
  • maiores do que X - e. g. a probabilidade de os valores de dados serem maiores que 95
  • entre X 1 e X 2 - e. g. probabilidade de valores de dados entre 65 e 85

onde X é um valor de interesse (exemplos abaixo).

O traçado e o cálculo da área nem sempre são convenientes, pois diferentes conjuntos de dados terão significados diferentes e valores de stddev.Para facilitar um método padrão uniforme para cálculos fáceis e aplicabilidade a problemas do mundo real, a conversão padrão para valores Z foi introduzida, que formam a parte da Tabela de Distribuição Normal .

Z = (X-mean) / stddev, onde X é a variável aleatória.

Basicamente, esta conversão obriga a média e stddev a ser padronizada para 0 e 1, respectivamente, o que permite que um conjunto definido padrão de valores Z (da Tabela de distribuição normal ) seja usado para cálculos fáceis . Um snap-shot da tabela padrão de valores z contendo valores de probabilidade é o seguinte:

z

0. 00

0. 01

0. 02

0. 03

0. 04

0. 05

0. 06

0. 0

0. 00000

0. 00399

0. 00798

0. 01197

0. 01595

0. 01994

0. 1

0. 0398

0. 04380

0. 04776

0. 05172

0. 05567

0. 05966

0. 2

0. 0793

0. 08317

0. 08706

0. 09095

0. 09483

0. 09871

0. 3

0. 11791

0. 12172

0. 12552

0. 12930

0. 13307

0. 13683

0. 4

0. 15542

0. 15910

0. 16276

0. 16640

0. 17003

0. 17364

0. 5

0. 19146

0. 19497

0. 19847

0. 20194

0. 20540

0. 20884

0. 6

0. 22575

0. 22907

0. 23237

0. 23565

0. 23891

0. 24215

0. 7

0. 25804

0. 26115

0. 26424

0. 26730

0. 27035

0. 27337

Para encontrar a probabilidade relacionada ao valor z de 0. 239865 , primeiro rodá-lo para 2 casas decimais (ou seja, 0. 24). Em seguida, verifique os 2 primeiros dígitos significativos (0. 2) nas linhas e para o dígito menos significativo (restantes 0. 04) na coluna. Isso levará ao valor de 0. 09483.

A tabela de distribuição normal completa, com precisão até 5 decimais para valores de probabilidade (incluindo aqueles para valores negativos), pode ser encontrada aqui.

Vamos ver alguns exemplos da vida real. Altura dos indivíduos em um grande grupo segue um padrão de distribuição normal. Suponha que temos um conjunto de 100 indivíduos cujas alturas são gravadas e a média e stddev são calculadas para 66 e 6 polegadas, respectivamente.

Aqui estão algumas perguntas de amostra que podem ser facilmente respondidas usando a tabela de valor z:

  • Qual a probabilidade de uma pessoa no grupo ter 70 polegadas ou menos?

Pergunta é encontrar valor cumulativo de P (X <= 70) i. e. em todo o conjunto de dados de 100, quantos valores serão entre 0 e 70.

Vamos primeiro converter o valor X de 70 para o valor Z equivalente.

Z = (X - média) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (rodada para 2 casas decimais)

Agora precisamos encontrar P (Z <= 0. 67) = 0. 24857 (da tabela z acima)

i. e. existe uma probabilidade de 24. 857% de que um indivíduo do grupo seja menor ou igual a 70 polegadas.

Mas segure - o acima está incompleto.Lembre-se, estamos à procura de probabilidade de todas as alturas possíveis até 70 i. e. de 0 a 70. O acima apenas lhe dá a parcela do valor médio para o valor desejado (i. e 66 a 70). Precisamos incluir a outra metade - de 0 a 66 - para chegar à resposta correta.

Uma vez que 0 a 66 representa a metade da parcela (ou seja, uma média extrema a média), sua probabilidade é simplesmente 0. 5.

Portanto, a probabilidade correta de uma pessoa ser 70 polegadas ou menos = 0. 24857 + 0. 5 = 0. 74857 = 74. 857%

Graficamente (ao calcular a área), estas são as duas regiões somadas que representam a solução:

  • Qual a probabilidade de uma pessoa ter 75 polegadas ou mais?

i. e. Encontre Complementar cumulativo P (X> = 75).

Z = (X - média) / stddev = (75-66) / 6 = 9/6 = 1. 5

P (Z> = 1. 5) = 1- P (Z <= 1. 5) = 1 - (0. 5 + 0. 43319) = 0. 06681 = 6. 681%

  • Qual a probabilidade de uma pessoa estar entre 52 polegadas e 67 polegadas?

Encontre P (52 <= x <= 67).

P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2. 33 <= z <= 0. 17)

= P (Z <= 0. 17) -p (Z <= -0. 233) = (0. 5 + 0. 56749) - (.40905) =

Este normal a tabela de distribuição (e os valores z) geralmente encontra uso para cálculos de probabilidade sobre movimentos de preços esperados no mercado de ações para ações e índices. Eles são usados ​​na negociação baseada em escala, identificando tendência de alta ou tendência de baixa, níveis de suporte ou resistência e outros indicadores técnicos baseados em conceitos de distribuição normais de desvio padrão e padrão.