A fórmula de distribuição normal é baseada em dois parâmetros simples - média e desvio padrão - que quantificam a características de um determinado conjunto de dados. Enquanto a média indica o valor "central" ou médio de todo o conjunto de dados, o desvio padrão indica o "spread" ou a variação dos pontos de dados em torno desse valor médio.
Considere os seguintes 2 conjuntos de dados:
Conjunto de dados 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Conjunto de dados 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Para Dataset1, significa = 10 e desvio padrão (stddev) = 0
Para Dataset2, significa = 10 e desvio padrão (stddev) = 2. 83
Vamos traçar esses valores para DataSet1:
Similarmente para DataSet2:
A linha horizontal vermelha nos dois gráficos acima indica o valor "médio" ou médio de cada conjunto de dados (10 em ambos os casos). As setas rosa no segundo gráfico indicam a propagação ou variação de valores de dados a partir do valor médio. Isso é representado pelo valor de desvio padrão de 2. 83 no caso de DataSet2. Uma vez que DataSet1 tem todos os valores iguais (como 10 cada) e sem variações, o valor stddev é zero e, portanto, não há setas rosa aplicáveis.
O valor stddev possui algumas características significativas e úteis que são extremamente úteis na análise de dados. Para uma distribuição normal, os valores de dados são distribuídos simetricamente em ambos os lados da média. Para qualquer conjunto de dados normalmente distribuído, trace o gráfico com stddev no eixo horizontal e não. de valores de dados no eixo vertical, obtém-se o seguinte gráfico.
Propriedades de uma distribuição normal
- A curva normal é simétrica sobre a média;
- A média está no meio e divide a área em duas metades;
- A área total abaixo da curva é igual a 1 para a média = 0 e stdev = 1;
- A distribuição é completamente descrita por sua média e stddev
Como pode ser visto a partir do gráfico acima, stddev representa o seguinte:
- 68. 3% de valores de dados estão dentro de 1 desvio padrão da média (-1 a +1)
- 95. 4% de valores de dados estão dentro de 2 desvios padrão da média (-2 a +2)
- 99. 7% de valores de dados estão dentro de 3 desvios padrão da média (-3 a +3)
A área sob a curva em forma de sino, quando medida, indica a probabilidade desejada de um dado faixa
- inferior a X: - e. g. a probabilidade de os valores de dados serem inferiores a 70
- maiores do que X - e. g. a probabilidade de os valores de dados serem maiores que 95
- entre X 1 e X 2 - e. g. probabilidade de valores de dados entre 65 e 85
onde X é um valor de interesse (exemplos abaixo).
O traçado e o cálculo da área nem sempre são convenientes, pois diferentes conjuntos de dados terão significados diferentes e valores de stddev.Para facilitar um método padrão uniforme para cálculos fáceis e aplicabilidade a problemas do mundo real, a conversão padrão para valores Z foi introduzida, que formam a parte da Tabela de Distribuição Normal .
Z = (X-mean) / stddev, onde X é a variável aleatória.
Basicamente, esta conversão obriga a média e stddev a ser padronizada para 0 e 1, respectivamente, o que permite que um conjunto definido padrão de valores Z (da Tabela de distribuição normal ) seja usado para cálculos fáceis . Um snap-shot da tabela padrão de valores z contendo valores de probabilidade é o seguinte:
z |
0. 00 |
0. 01 |
0. 02 |
0. 03 |
0. 04 |
0. 05 |
0. 06 |
0. 0 |
0. 00000 |
0. 00399 |
0. 00798 |
0. 01197 |
0. 01595 |
0. 01994 |
… |
0. 1 |
0. 0398 |
0. 04380 |
0. 04776 |
0. 05172 |
0. 05567 |
0. 05966 |
… |
0. 2 |
0. 0793 |
0. 08317 |
0. 08706 |
0. 09095 |
0. 09483 |
0. 09871 |
… |
0. 3 |
0. 11791 |
0. 12172 |
0. 12552 |
0. 12930 |
0. 13307 |
0. 13683 |
… |
0. 4 |
0. 15542 |
0. 15910 |
0. 16276 |
0. 16640 |
0. 17003 |
0. 17364 |
… |
0. 5 |
0. 19146 |
0. 19497 |
0. 19847 |
0. 20194 |
0. 20540 |
0. 20884 |
… |
0. 6 |
0. 22575 |
0. 22907 |
0. 23237 |
0. 23565 |
0. 23891 |
0. 24215 |
… |
0. 7 |
0. 25804 |
0. 26115 |
0. 26424 |
0. 26730 |
0. 27035 |
0. 27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
Para encontrar a probabilidade relacionada ao valor z de 0. 239865 , primeiro rodá-lo para 2 casas decimais (ou seja, 0. 24). Em seguida, verifique os 2 primeiros dígitos significativos (0. 2) nas linhas e para o dígito menos significativo (restantes 0. 04) na coluna. Isso levará ao valor de 0. 09483.
A tabela de distribuição normal completa, com precisão até 5 decimais para valores de probabilidade (incluindo aqueles para valores negativos), pode ser encontrada aqui.
Vamos ver alguns exemplos da vida real. Altura dos indivíduos em um grande grupo segue um padrão de distribuição normal. Suponha que temos um conjunto de 100 indivíduos cujas alturas são gravadas e a média e stddev são calculadas para 66 e 6 polegadas, respectivamente.
Aqui estão algumas perguntas de amostra que podem ser facilmente respondidas usando a tabela de valor z:
- Qual a probabilidade de uma pessoa no grupo ter 70 polegadas ou menos?
Pergunta é encontrar valor cumulativo de P (X <= 70) i. e. em todo o conjunto de dados de 100, quantos valores serão entre 0 e 70.
Vamos primeiro converter o valor X de 70 para o valor Z equivalente.
Z = (X - média) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (rodada para 2 casas decimais)
Agora precisamos encontrar P (Z <= 0. 67) = 0. 24857 (da tabela z acima)
i. e. existe uma probabilidade de 24. 857% de que um indivíduo do grupo seja menor ou igual a 70 polegadas.
Mas segure - o acima está incompleto.Lembre-se, estamos à procura de probabilidade de todas as alturas possíveis até 70 i. e. de 0 a 70. O acima apenas lhe dá a parcela do valor médio para o valor desejado (i. e 66 a 70). Precisamos incluir a outra metade - de 0 a 66 - para chegar à resposta correta.
Uma vez que 0 a 66 representa a metade da parcela (ou seja, uma média extrema a média), sua probabilidade é simplesmente 0. 5.
Portanto, a probabilidade correta de uma pessoa ser 70 polegadas ou menos = 0. 24857 + 0. 5 = 0. 74857 = 74. 857%
Graficamente (ao calcular a área), estas são as duas regiões somadas que representam a solução:
- Qual a probabilidade de uma pessoa ter 75 polegadas ou mais?
i. e. Encontre Complementar cumulativo P (X> = 75).
Z = (X - média) / stddev = (75-66) / 6 = 9/6 = 1. 5
P (Z> = 1. 5) = 1- P (Z <= 1. 5) = 1 - (0. 5 + 0. 43319) = 0. 06681 = 6. 681%
- Qual a probabilidade de uma pessoa estar entre 52 polegadas e 67 polegadas?
Encontre P (52 <= x <= 67).
P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2. 33 <= z <= 0. 17)
= P (Z <= 0. 17) -p (Z <= -0. 233) = (0. 5 + 0. 56749) - (.40905) =
Este normal a tabela de distribuição (e os valores z) geralmente encontra uso para cálculos de probabilidade sobre movimentos de preços esperados no mercado de ações para ações e índices. Eles são usados na negociação baseada em escala, identificando tendência de alta ou tendência de baixa, níveis de suporte ou resistência e outros indicadores técnicos baseados em conceitos de distribuição normais de desvio padrão e padrão.
Eu sou comprador inicial pela primeira vez. Se eu tomar uma distribuição da minha 401 (k) para comprar uma terra e uma casa, eu vou ter que pagar uma penalidade nesta distribuição? Além disso, que tipo de formulário vou precisar para arquivar com meus impostos, mostrando o IRS que US $ 10 000 foram para um
Como você pode já saber, você deve atender a certos requisitos, descritos no 401 (k ) documento do plano, para ser considerado elegível para receber uma distribuição do plano. Seu empregador ou administrador do plano fornecerá uma lista dos requisitos. Os valores retirados do seu plano 401 (k) e utilizados para a compra de sua casa estarão sujeitos a imposto de renda e a uma penalidade de distribuição antecipada de 10%.
É Minha distribuição Roth IRA não qualificada sujeita a impostos ou penalidades de distribuição antecipada?
As regras de pedido devem ser aplicadas para determinar se a distribuição está sujeita a impostos sobre o rendimento e / ou a penalidade de distribuição antecipada. De acordo com essas regras de ordenação, as distribuições são retiradas de fontes de financiamento na seguinte ordem: Contribuições regulares Roth conversões Ganhos Nota: Os montantes de conversão Roth não são considerados distribuídos até que todos os montantes da contribuição tenham sido distribuídos; Os ganhos não são considerados
Quais são as exceções à penalidade de distribuição antecipada para uma distribuição Roth IRA não qualificada?
As exceções são as seguintes: A distribuição é feita em ou após a data em que atinge a idade de 59. 5 A distribuição é feita enquanto você está desativado e você pode fornecer a prova de que você não pode fazer nenhuma atividade lucrativa substancial por causa de sua condição física ou mental.