O que é mediana, média, moda em estatística?
A mediana é uma medida de tendência central em estatística. Ela representa o valor que divide uma amostra ou conjunto de dados ordenados em dois grupos de números de elementos iguais.
Em outras palavras, mediana é o valor que se encontra no meio de uma série de dados ordenados.
O que é média?
A média é essencialmente um modelo do seu conjunto de dados. É o valor mais comum.
Você notará, no entanto, que a média geralmente não é um dos valores reais que você observou em seu conjunto de dados. No entanto, uma de suas propriedades importantes é que ele minimiza o erro na previsão de qualquer valor em seu conjunto de dados. Ou seja, é o valor que produz a menor quantidade de erro de todos os outros valores no conjunto de dados.
Uma propriedade importante da média é que ele inclui todos os valores em seu conjunto de dados como parte do cálculo. Além disso, a média é a única medida de tendência central em que a soma dos desvios de cada valor da média é sempre zero.
A média tem uma desvantagem principal: é particularmente suscetível à influência de outliers. Estes são valores incomuns em comparação com o resto do conjunto de dados, sendo especialmente pequenos ou grandes em valor numérico.
Com a certificação Black Belt, conquiste sólido conhecimento das ferramentas da metodologia, além de competências para coordenar pessoas e projetos de melhoria que irão impactar os indicadores da organização em que você atua. Torne-se um especialista em Lean Seis Sigma.
O que é Mediana?
A mediana de um conjunto de números é em que metade dos números são mais baixos e a metade dos números são maiores.
Por exemplo, no caso imobiliário, isso significa que a mediana é o preço em que a metade das casas vendidas naquele mês era mais barata e a metade era mais cara.
Se o número da quantidade de elementos é par, a gente calcula a mediana pela média aritmética dos dois valores centrais. Se o número de observações é uma quantidade ímpar, a mediana é o valor central. A mediana é menos afetada por valores extremos (outliers) do que a média aritmética.
Qual a diferença entre Mediana e Média?
A média de um conjunto de números é o total dos números dessa quantidade de elementos divididos pelo número de itens nesse conjunto. A mediana e a média podem estar próximas ou não. Tudo depende dos números.
Quando geralmente preferimos a mediana sobre a média (ou moda) é quando nossos dados estão distorcidos (ou seja, a distribuição de frequência para nossos dados está distorcida).
Se considerarmos a distribuição normal - como esta é a mais frequentemente avaliada em estatísticas - quando os dados são perfeitamente normais, a média, a moda e a mediana são idênticos. Além disso, representam o valor mais típico no conjunto de dados.
No entanto, à medida que os dados se desviam, seja em ordem crescente ou decrescente, a média perde sua capacidade de fornecer a melhor localização central para os dados porque os dados distorcidos estão arrastando-o para longe do valor típico. Nesses casos, é a mediana que melhor conserva essa posição e não é tão fortemente influenciada pelos valores distorcidos.
Exemplo:
Aqui estão 11 preços de apartamentos.
- R$ 100,000
- R$ 101,000
- R$ 102,000
- R$ 103,000
- R$ 104,000
- R$ 105,000
- R$ 106,000
- R$ 107,000
- R$ 650,000
- R$ 1.000.000
- R$ 3.000.000
A mediana dos preços desses 11 apartamentos é de R$ 105.000. Cinco apartamentos eram de preço mais baixo e cinco apartamentos tinham preços mais altos. O preço médio desses 11 apartamentos é de R$ 498.000. Isso é o que você obtém se somar todos esses preços e dividir por 11.
Que diferença! Quando você está olhando para os preços das casas, certifique-se de saber se os números são médias ou medianas. Ambos os números fornecem boa informação, mas eles têm implicações diferentes.
Quais as outras diferenças?
Embora a média seja uma estatística comumente utilizada e bem compreendida, a mediana também é um descritor comum usado para expressar um valor "médio" em um conjunto de dados. Esse valor "médio" também é conhecido como a tendência central. A mediana é determinada ao classificar os dados do maior ao menor, e depois identificar o meio para que haja um número igual de valores de dados maiores e menores do que é.
Enquanto a média e a mediana podem ser iguais ou quase iguais, elas são diferentes se os valores dos dados estiverem agrupados em direção a uma extremidade de seu alcance e/ou se houver alguns valores extremos.
Na terminologia estatística, isso se chama "skewness". Neste caso, a média pode ser significativamente influenciada pelos poucos valores, o que não é muito representativo da maioria dos valores no conjunto de dados. Nessas circunstâncias, a mediana dá uma melhor representação da tendência central do que a média.
O que é moda?
A moda é a pontuação mais frequente em nosso conjunto de dados.
Em um histograma, representa a barra mais alta do gráfico. Você pode, portanto, considerar a moda como sendo a opção mais popular. Normalmente, a moda é usada para dados categóricos onde desejamos saber qual é a categoria mais comum.
No entanto, um dos problemas com a moda é que ela não é única, então nos deixa com problemas quando temos dois ou mais valores que compartilham a frequência mais alta.
Agora, estamos presos quanto a moda que melhor descreve a tendência central dos dados. Isso é particularmente problemático quando temos dados contínuos, porque é mais provável que não possamos ter um valor mais frequente do que o outro.
Por exemplo, considere medir o peso de 30 pessoas (para 0,1 kg mais próximo). Quão provável é que encontremos duas ou mais pessoas com exatamente o mesmo peso (por exemplo, 67,4 kg)?
A resposta é muito improvável - pessoas podem estar perto, mas com uma amostra tão pequena (30 pessoas) e uma grande variedade de pesos possíveis, é improvável que você encontre duas pessoas exatamente com o mesmo peso, isto é, aos 0,1 kg mais próximos. É por isso que a moda é muito raramente usada com dados contínuos.