Qual a diferença entre intervalo de confiança, previsão e tolerância?
Nas estatísticas, como na vida, a certeza absoluta é rara. É por isso que os estatísticos muitas vezes não podem fornecer um resultado tão específico quanto gostaríamos. Em vez disso, eles fornecem os resultados de uma análise como um intervalo, dentro do qual os dados sugerem a verdadeira incerteza daquela resposta. Por isso, o Green Belt e o Black Belt tanto falam sobre isso. Saber sobre isso é importante na hora de aplicar as ferramentas:
- Gráfico de Tendência: o que é como elaborar um gráfico de tendência
- O que é Histograma? Quando utilizar? Como construir?
- Gráfico de Controle: Como e quando aplicar?
- O que é Regressão Linear? Conheça como economizar milhões
A maioria de nós está familiarizado com os "intervalos de confiança", mas esse é um dos diversos tipos de intervalos que podemos usar para caracterizar os resultados de uma análise. Às vezes, os intervalos de confiança não são a melhor opção. Vejamos as características de alguns tipos diferentes de intervalos e quando e onde eles devem ser usados. Especificamente, analisaremos intervalos de confiança, intervalos de previsão e intervalos de tolerância.
O que é o Intervalo de Confiança?
Um intervalo de confiança refere-se a uma gama de valores que provavelmente conterá o valor de um parâmetro de população desconhecida, como a média, com base nos dados amostrados dessa população.
Recolhido aleatoriamente, é improvável que duas amostras de uma determinada população tenham intervalos de confiança idênticos. Mas se a população for amostrada uma e outra vez, uma certa porcentagem desses intervalos de confiança conterá o parâmetro da população desconhecida. A porcentagem desses intervalos de confiança que contém esse parâmetro é o nível de confiança do intervalo.
Os intervalos de confiança são mais utilizados para expressar a média da população ou desvio padrão, mas também podem ser calculados para proporções, coeficientes de regressão, taxas de ocorrência (Poisson) e para as diferenças entre as populações em testes de hipóteses.
Se medimos a vida de lâmpadas de uma amostra aleatória e o Minitab calcula 1230 - 1265 horas com o intervalo de confiança de 95%, isso significa que podemos confiar 95% que a média da duração para a população de bulbos cairá entre 1230 e 1265 horas.
Em relação ao parâmetro de interesse, os intervalos de confiança apenas avaliam o erro de amostragem - o erro inerente na estimativa de uma característica de população de uma amostra. Os tamanhos de amostra maiores diminuirão o erro de amostragem e resultarão em intervalos de confiança menores (mais estreitos). Se você pudesse experimentar toda a população, o intervalo de confiança teria uma largura de 0: não haveria nenhum erro de amostragem, pois obteve o parâmetro real para toda a população!
Além disso, os intervalos de confiança apenas fornecem informações sobre a média, o desvio padrão ou qualquer que seja o seu parâmetro de interesse. Não diz nada sobre como os valores individuais estão distribuídos.
O que isso significa em termos práticos?
Isso significa que o intervalo de confiança tem algumas limitações sérias. Neste exemplo, podemos ter 95% de confiança de que a média da duração em horas das lâmpadas cairá entre 1230 e 1265 horas. Mas esse intervalo de confiança de 95% não indica que 95% das lâmpadas cairão nesse intervalo. Para desenhar uma conclusão como essa, é necessário um intervalo diferente ...
O que é o Intervalo de Previsão?
Um intervalo de predição é um intervalo de confiança para previsões derivadas de modelos de regressão linear e não-linear. Existem dois tipos de intervalos de previsão.
Intervalo de confiança da previsão
Dado configurações específicas dos preditores em um modelo, o intervalo de confiança da predição é um intervalo que provavelmente contém a resposta média. Como intervalos de confiança regulares, o intervalo de confiança da predição representa um intervalo para a média, e não para a distribuição dos dados individuais.
Com relação às lâmpadas, poderíamos testar como diferentes técnicas de fabricação (Lentas ou rápidas) e filamentos (A ou B) afetam a vida da lâmpada. Depois de montar um modelo, podemos usar o software estatístico para prever a vida das lâmpadas feitas usando o filamento A sob o método Rápido.
Se o intervalo de confiança da previsão for 1400-1450 horas, podemos ter 95% de confiança em que a vida média das lâmpadas feitas sob essas condições está dentro dessa faixa. No entanto, esse intervalo não nos diz nada sobre como as vidas das lâmpadas individuais são distribuídas.
Intervalo de previsão
Um intervalo de previsão é um intervalo que provavelmente conterá o valor de resposta de uma nova observação individual em configurações especificadas de seus preditores.
Se o Minitab calcular um intervalo de previsão de 1350-1500 horas para uma lâmpada produzida nas condições descritas acima, podemos ter 95% de confiança de que o tempo de vida de uma nova lâmpada produzida com essas configurações estará dentro desse alcance.
Você notará que o intervalo de previsão é mais amplo do que o intervalo de confiança da predição. Isso sempre será verdade, porque a incerteza adicional está envolvida quando queremos prever uma resposta única, em vez de uma resposta média.
O que são os Intervalos de Tolerância?
Um intervalo de tolerância é um intervalo que provavelmente contém uma proporção definida de uma população. Para calcular os intervalos de tolerância, você deve estipular a proporção da população e o nível de confiança desejado - a probabilidade de que a proporção mencionada esteja realmente inclusa no intervalo. Isso é mais fácil de entender quando você olha um exemplo.
Exemplo de intervalo de tolerância
Para avaliar quanto tempo duraram as lâmpadas, a empresa de lâmpadas amostrou 100 lâmpadas aleatoriamente e registrou quanto tempo elas duraram.
Para usar esses dados para calcular os intervalos de tolerância, vá para Stat> Ferramentas de qualidade> Intervalos de tolerância no Minitab. Em Dados, escolha Amostras em colunas. Na caixa de texto, insira Horas. Em seguida, clique em OK.
O teste de normalidade indica que esses dados seguem a distribuição normal, então podemos usar o intervalo Normal (1060 1435). A empresa pode ter 95% de confiança de que pelo menos 95% de todas as lâmpadas durarão entre 1060 e 1435 horas.
Como os intervalos de tolerância se comparam aos intervalos de confiança?
Como mencionamos anteriormente, a largura de um intervalo de confiança depende inteiramente do erro de amostragem. Quanto mais perto a amostra chegar de incluir toda a população, menor a largura do intervalo de confiança, até chegar a zero.
Mas a largura de um intervalo de tolerância baseia-se não apenas no erro de amostragem, mas também na variação da população. À medida que o tamanho da amostra se aproxima de toda a população, o erro de amostragem diminui e os percentis estimados se aproximam dos percentis da população verdadeira.
O Minitab calcula os valores de dados que correspondem aos percentis 2.5º e 97.5º estimados (97.5 - 2.5 = 95) para determinar o intervalo em que 95% da população cai.
Porque estamos usando uma amostra, as estimativas percentis terão erro. Uma vez que não podemos dizer que um intervalo de tolerância realmente contém a proporção especificada com 100% de confiança, os intervalos de tolerância também têm um nível de confiança.
Como os intervalos de tolerância são usados?
Os intervalos de tolerância são muito úteis quando você deseja prever uma série de resultados prováveis com base em dados amostrados.
Na melhoria da qualidade, os profissionais geralmente exigem que uma saída do processo (como a vida de uma lâmpada) caia dentro dos limites da especificação. Ao comparar os requisitos do cliente com os limites de tolerância que cobrem uma proporção especificada da população, os intervalos de tolerância podem detectar variações excessivas. Um intervalo de tolerância maior do que os requisitos do cliente pode indicar que a variação do produto é muito alta.
O software estatístico Minitab facilita a obtenção desses intervalos, independentemente daquela que você precisa usar para seus dados.