Como analisar dados da produção de caminhões?
A fim analisar alguns dados do mercado de veículos, tive de garimpar. Se você for como eu, alguém que gosta de analisar mais os dados do que as fantasiosas notícias, deve ter trabalho. Foram exatos 44 minutos, nesse belo domingo de sol, até encontrar uma fonte de dados possível de ser acessada.
A minha primeira fonte de busca foi o site da FENABRAVE, mas lá, só encontrei pdfs com comparações mensais. Sabe aquela coisa que não leva a lugar nenhum? Comparar um mês contra o outro ou um período desse ano com o ano passado? Sim, caro leito. O pessoal rasga o “entender a variação” do Saber Profundo do Deming e fica comparando variações de causas normais.
Depois dessa busca, cheguei até o site da ANFAVEA e lá, encontrei uma boa base. No site, há um link para as séries históricas que são baixadas rapidamente em Excel. Como é bom encontrar locais assim, cujos dados são estruturados por quem entende. Mas, vamos ao que interessa, correto? Vamos para a análise do mercado de veículos no Brasil.
Como estão as vendas de caminhões?
Para começar a análise, sugiro irmos pelo básico. E, qual é o gráfico básico para analisarmos uma série temporal? O famoso gráfico de tendência (ou linhas), ou como o próprio nome em inglês já diz: Times Series Plot. Na figura 1 vamos mostrar o gráfico de tendência para a produção de caminhões no Brasil e para o número de licenciamentos de caminhões nacionais.
Figura 1: Gráfico de tendência da produção e do licenciamento de caminhões nacionais.
Pela figura 1, por meio desse gráfico simples, dá para perceber que a queda no mercado de 2012 para cá foi forte. Também fica claro, que o a produção está em linha com os licenciamentos, ou seja, parece que a indústria acompanha o mercado interno. As exportações ainda não são suficientes para manter nossa produção aquecida, mesmo quando ocorrem quedas acentuadas nas vendas.
Como fazer um gráfico de controle para análise de dados?
Se você é um Green Belt ou Black Belt formado por nossa escola, posso apostar que ao ler essa notícia até sua cabeça já está falando: gráfico de controle, gráfico de controle... Calma. Vamos nessa. Mas a dúvida que surge: qual gráfico utilizar?
Qual o tipo de variável?
Volume produzido de um item é uma variável contínua, contagem ou classificatória? Como não conseguimos produzir meio caminhão, dizemos que a produção é uma variável discreta, portanto, a classificamos como contagem. Correto? Não. Produção não é uma variável de atributo, pois não quero contar defeitos ou problemas numa população. Desse modo, para analisar a produção de caminhões, tenho de lançar mão de uma carta de controle para variáveis.
Porém, vocês lembram que a suposição que tenho que fazer para utilizar os gráficos de controle para variáveis (X-barra R, X-barra s, I e MR ou CUSUM) é que a distribuição é normal. Mas será que a distribuição é realmente normal? Para checar a normalidade dos resultados individuais ou médios da característica, várias técnicas podem ser aplicadas, como o uso de histogramas, testes de aderência (Anderson-Darling, Kolmogorov-Smirnov ou Shapiro-Wilk) ou gráficos de probabilidade (Q-Q plot ou papel de probabilidade).
Já falamos aqui no blog, sobre os procedimentos para a realização do teste de normalidade usando o software Minitab. Mas aqui, para testar a normalidade, vamos utilizar um gráfico de probabilidade, ou probability plot.
Figura 2: gráfico de probabilidade da produção de caminhões.
Pela figura 2 é possível enxergarmos que a distribuição não é normal. E, se pensarmos um pouco, faz sentido, não é mesmo? Não poderíamos esperar que a produção mensal de caminhões, do ano que meu pai nasceu (1957) até agora teria uma distribuição normal. Ficar 60 anos estagnado em termos de volume de produção, significaria que nossa produção de itens transportados por caminhões, não cresceu nesse período. Diante desse cenário, o que fazer? Transformação Box-Cox? Não sei, vamos testar.
Como tratar distribuição não normal?
Figura 3: transformação Box-Cox da produção de caminhões.
Pela figura 3, temos a transformação Box-Cox. Agora, é importante verificarmos se a transformação foi suficiente para normalizar a distribuição. E como fazemos isso? Probability Plot novamente.
Figura 4: gráfico de probabilidade da transformação Box-Cox da produção de caminhões.
Pela figura 4, parece que os dados estão normalizados a contento, porém, ainda não é uma distribuição perfeitamente normal. Se fizermos um gráfico de individuais, iremos observar problemas. Apenas olhando para a figura 4, é nítido que há 3 distribuições diferentes: uma no início, outra no meio da série e outra ao final. Vamos fazer um gráfico de individuais da variável transformada para analisar isso.
Figura 5: gráfico de individuais da transformada da produção de caminhões.
Pela figura 5, dá para perceber que o volume de vendas mudou de comportamento. Voltamos ao padrão de vendas do final dos anos 80, início dos anos 90. O que faremos com nossos trabalhadores? Se estamos produzindo como produzíamos no final dos 80 e, com muita mais tecnologia, podemos pensar que a mão de obra necessária para isso será muito menor. Parece que não dá para esperar muito dessa indústria na hora da retomada dos empregos no país. Agora, dá para fazer uma análise melhor que essa?
Como modelar a evolução da produção?
Agora começa a arte. Na verdade, não é arte. É treino. O que desejamos saber quando olhamos para o gráfico da produção de caminhões? Gostaríamos de saber se a indústria está crescendo ou decrescendo. E como poderíamos medir crescimento na produção? Ponto para você que pensou se nós compararmos um mês com o outro.
Que tal uma série tempo da variação na produção? Por que isso? Porque assim é possível entender se a variação mensal foi algo acima do esperado. Se observamos um crescimento acima do esperado nesse mês e a variação da produção seguir uma distribuição normal, então teríamos uma probabilidade de uma variação não tão grande no outro mês. Vamos para essa análise?
Figura 6: histograma da variação da produção de caminhões e o gráfico de probabilidade.
Pela figura 6, a distribuição não é perfeitamente normal, mas daria para fazermos um gráfico de controle de individuais antes de transformarmos.
Figura 7: gráfico de individuais da variação da produção de caminhões.
Pela figura 7, nesse período, podemos esperar variações entre -6% até +6% na venda de caminhões. Portanto, se sua equipe se motivar porque esse mês as vendas cresceram 5%, cuidado. Pode ser uma motivação sem fundamento técnico, haja vista que uma variação de até 6% positiva é algo natural e esperado. Por meio desse gráfico, é possível analisar quando alguma coisa está acontecendo na produção de caminhões. Dá para perceber que nos períodos de mudança, seja na crise da moratória do começo dos anos 80, no tenebroso 92 do Collor, na crise cambial de 99, nos incentivos do primeiro governo Dilma ou na derrocada do segundo governo, a variação saía do controle.
E o gráfico de controle x-barra?
Boa pergunta caro leitor. Como utilizar o gráfico de controle x-barra? Da mesma maneira que utilizamos o gráfico de individuais na figura 5. Que tal compararmos ano a ano e decênio a decênio? Como assim? Utilizando o tamanho de subgrupo 12 e o 120. Vamos ver como fica?
Figura 8: transformada da produção anual.
Figura 9: transformada da produção decênio.
Ambas as figuras (8 e 9), mostram que voltamos para o final da década de 90 quando o assunto é produção de caminhões. Época do Mamonas Assassinas para o Brasil e da sétima série para mim. É, caros amigos, apesar da crise estar passando, podemos falar em uníssono: ela foi bastante grande.