O que é p-valor? Por que o 0,01 significa tanto?
O que é o p-valor?
Quem fez algum curso de Estatística, seja o Green Belt ou Planejamento de Experimentos, já deve ter ouvido bastante o termo p-valor ou p-value. Na maioria das vezes, consultores e treinadores repetem aos alunos que em todo teste de hipótese, deve-se verificar se o p-valor é menor do que 0,01 para refutar a hipótese de que os tratamentos escolhidos sejam iguais.
Com p-valor menor que 0,01, dizem os especialistas que os tratamentos que você está comparando, são diferentes. Porém, poucos falam sobre o que significa este tal de p-valor. E você, sabe o que significa realmente p-valor e de onde ele veio?
Pela forte veia acadêmica que a FM2S possui, achamos que tirar regras do “bolso do colete” sem explicar de onde vieram aos alunos, uma receita fadada ao fracasso. Por mais apologias que se façam à decoreba e aos softwares mágicos, julgamos não ser digno tratar aos adultos que confiam seus suados salários a nós, desta maneira. Se alguém acessa nosso site e compra um curso conosco, julgamos que ele não espera ser atendido por um “professor” sem um conhecimento profundo da matéria. Imaginamos a decepção que o aluno teria ao comprar de um doutor com forte experiência na indústria e ser atendido por um recém-formado ou por alguém que considere o estudo, algo secundário.
Mas o que significa o p-valor?
Então, entender o p-valor é algo importante para nós. Para isto, vamos beber nas fontes. R. A. Fisher referia-se a probabilidade que se permite declarar a significância de um teste, como p-valor. Fisher não tinha dúvida quanto ao significado e a importância deste termo, porém nunca declarou de onde estes testes foram derivados ou indicou o valor exato para se considerar o p-valor significante.
Fisher, em seu livro Statistical Methods for Reaserch Workers mostra exemplos de alguns cálculos e diz se os resultados foram significativos ou não. Em um destes exemplos, ele mostra um p-valor menor que 0,01 e declara:
“Somente um valor em 100 sairá ao acaso, portanto, esta diferença é claramente significativa”.
O mais próximo que Fisher chegou de definir um p-valor específico para refutar ou aceitar a hipótese nula, foi num artigo publicado no Procedings of the Society for Psychal Research em 1929. Fisher criticava, no artigo, a maneira pela qual os pesquisadores tentavam mostrar, por meio do método científico, a existência de clarividência. Tais pesquisadores faziam um uso extensivo de testes de significância Estatística para mostrar que a probabilidade de seus resultados terem sido alcançados ao acaso, era muito pequena. Porém, Fisher condenou a maneira como os autores da revista utilizavam os testes de significância Estatística.
O que Fisher disse sobre o p-valor?
Para Fisher, o teste de significância só fazia sentido se fosse feito no contexto de uma sequência de experimentos, todos com o objetivo de elucidar os efeitos de tratamentos específicos. Coletar vários dados sem que tenham sido conduzidos experimentos, para Fisher, não fazia sentido para estudar efeitos de diferentes tratamentos. Pasmem vocês, mas na era do Big Data, isto está ficando cada vez mais comum. Apesar de errado, a maioria das pessoas acredita que aplicar testes em dados coletados ao acaso, seja uma boa maneira de entender o que está acontecendo.
Se você ler os artigos publicados pelo Fisher, você verá que há 3 conclusões possíveis para o resultado do p-valor. Se o valor é muito pequeno (menor que 0,01), ele declara que o efeito foi percebido. Se for muito grande (maior que 0,20), ele declara que, se há algum efeito, nenhum experimento do tamanho do que foi executado, será capaz de detectá-lo. Se o p-valor estiver entre estes dois valores de referência, ele afirma que o próximo experimento deverá ser planejado de forma que permita se obter entendimento melhor daquele efeito. Exceto por isto, Fisher nunca explicitou como o pesquisador ou especialista em melhoria deveria interpretar o p-valor. O que parecia muito intuitivo para Fisher, parece não ser tão intuitivo para os pseudo-especialistas por aí.
Quem foi Fisher?
R.A. As extraordinárias contribuições de Fisher para a teoria e os métodos estatísticos, o design experimental, a inferência científica, a biologia evolutiva e a genética tiveram consequências de longo alcance em muitos ramos do pensamento e esforço humanos. As conquistas deste cientista maravilhosamente dotado, enérgico e produtivo atraíram a atenção contínua, não só para seus sete livros e várias centenas de artigos (publicados em mais de 80 jornais diferentes), mas também por sua correspondência científica com seu conteúdo e ideias que provocam reflexão para desenvolvimento adicional.
Ronald Aylmer Fisher nasceu em uma família rica em Londres, Inglaterra, Reino Unido, em 17 de fevereiro de 1890. Ele era o segundo nascido de gêmeos. Seu pai, George Fisher, era um negociante de artes finas bem-sucedido, que dirigia uma empresa de leilões em importância com a Sotheby's ou Christie's. Sua mãe, Katie Heath, era filha de um advogado.
Os pais de Ronald podiam pagar a melhor educação particular para ele, mas sua vida de abundância era temporária. Sua mãe morreu de peritonite quando tinha 14 anos e, quando tinha 15 anos, o negócio de seu pai quebrou. A família mudou-se de uma mansão de luxo em uma das partes mais ricas de Londres – Hampstead – para uma pequena casa em uma das partes mais pobres – Streatham.
Como se deu sua educação?
Ronald continuou a ser educado na Harrow School. Não porque seu pai pudesse pagar as taxas muito altas, mas porque Ronald era um aluno brilhante e recebeu bolsas de estudo. Um de seus mestres depois comentou que, de todos os alunos que ele ensinara, Ronald era excepcionalmente brilhante.
Além das dificuldades da família, Ronald foi prejudicado por uma deficiência pessoal – sua espantosa falta de visão. Sua visão era tão ruim que ele não tinha permissão para ler sob luz elétrica porque esticou seus olhos demais. Este problema particular, no entanto, parece ter tido um benefício, mudando sua perspectiva sobre matemática. Ele aprendeu a visualizar problemas nos olhos de sua mente e resolvia-os na cabeça.
Biologia da Matemática
Fisher se viu como cientista, especialmente interessado em biologia. Apesar disso, ele não gostava de aprender os meandros e os nomes das estruturas biológicas. Ele decidiu estudar matemática, acreditando que era através da matemática que ele poderia fazer as maiores contribuições para a biologia.
Em 1909, aos 19 anos, ganhou uma bolsa de estudos para a Universidade de Cambridge. Três anos depois, ele se formou com honras de primeira classe em matemática. Embora claramente um matemático brilhante, seus tutores estavam duvidosos sobre seu futuro. Eles estavam preocupados que, em matemática, ele tendesse a "ver" a resposta correta e anotá-la, ao invés de passar pelos processos habituais de cálculo e prova.
Depois de se formar, Fisher passou mais um ano em Cambridge, estudando física na pós-graduação, incluindo a teoria dos erros, um tópico que aumentou seu interesse em estatísticas.
Eugenia
Fisher manteve um grande interesse pela evolução e genética durante seus dias de graduação. Ele estava particularmente interessado na eugenia: a melhoria da raça humana pela criação seletiva. A eugenia era então um tema científico respeitável e popular.
Fisher queria aumentar a proporção de pessoas "socialmente fortes". Ele preferiu a eugenia positiva (encorajando os seres humanos "socialmente fortes" a ter mais filhos) e não a eugenia negativa (impedindo que os humanos "socialmente fracos" tenham filhos).
Foi o interesse de Fisher na eugenia que primeiro o levou a olhar para a genética de uma população, levando-o a encontrar – junto com J. B. S. Haldane e Sewall Wright – a nova ciência da genética populacional.
Deste modo, quando for procurar um curso de Green ou Black Belt, pesquise e compare: os professores do curso estão alinhados com o que você espera do curso? Ou é alguém que apenas lhe repete que todo teste de hipótese só tem valor se você calcular o p-valor e ele der menor que 0,01? Este é nosso manifesto por um mundo mais verdadeiro, em que a desonestidade intelectual não tem vez. Abordados no White Belt, Green Belt e Black Belt, além do Lean do PMP.