Regressão Linear: vantagens e desvantagens
Análise de dados

05 de outubro de 2018

Última atualização: 25 de janeiro de 2023

Regressão Linear: vantagens e desvantagens

O que é Regressão Linear?

A regressão linear quantifica a relação entre uma ou mais variáveis ​​preditoras e uma variável de resultado. Por exemplo, a regressão linear pode ser usada para quantificar os impactos relativos de idade, sexo e dieta (as variáveis ​​preditoras) na altura (a variável de desfecho). A regressão linear é também conhecida como regressão múltipla, regressão multivariada, mínimos quadrados ordinários (OLS) e regressão.

As desvantagens da regressão linear

A regressão linear é um método estatístico para examinar a relação entre uma variável dependente, denotada como y, e uma ou mais variáveis ​​independentes, denotadas como x. A variável dependente deve ser contínua, pois pode assumir qualquer valor, ou pelo menos próximo de contínuo. As variáveis ​​independentes podem ser de qualquer tipo. Embora a regressão linear não possa mostrar a causação por si só, a variável dependente é geralmente afetada pelas variáveis ​​independentes.

Regressão linear é limitada a relacionamentos lineares

Por sua natureza, a regressão linear analisa apenas relações lineares entre variáveis ​​dependentes e independentes. Isto é, pressupõe que existe uma relação direta entre eles. Às vezes isso está incorreto. Por exemplo, a relação entre renda e idade é curva, ou seja, a renda tende a aumentar nas primeiras partes da vida adulta, se achatando na idade adulta e declinando depois que as pessoas se aposentam. Você pode dizer se isso é um problema, olhando representações gráficas dos relacionamentos.

Regressão Linear olha apenas para a média da variável dependente

A regressão linear analisa uma relação entre a média da variável dependente e as variáveis ​​independentes. Por exemplo, se você observar a relação entre o peso ao nascer dos bebês e as características maternas, como a idade, a regressão linear examinará o peso médio dos bebês nascidos de mães de diferentes idades.

No entanto, às vezes você precisa olhar para os extremos da variável dependente, por exemplo, bebês correm risco quando seus pesos estão baixos, então você gostaria de ver os extremos neste exemplo.

Assim como a média não é uma descrição completa de uma única variável, a regressão linear não é uma descrição completa das relações entre as variáveis. Você pode lidar com esse problema usando a regressão quantílica.

Os dados devem ser independentes

A regressão linear assume que os dados são independentes. Isso significa que as pontuações de um sujeito (como uma pessoa) não têm nada a ver com as de outro. Isso é muitas vezes, mas nem sempre, sensato. Dois casos comuns em que não faz sentido são agrupados no espaço e no tempo.

Um exemplo clássico de agrupamento no espaço são os resultados dos testes dos alunos, quando você tem alunos de várias classes, séries, escolas e distritos escolares. Alunos da mesma turma tendem a ser parecidos em muitos aspectos, ou seja, muitas vezes vêm dos mesmos bairros, possuem os mesmos professores, etc. Assim, não são independentes.

Exemplos de clustering no tempo são quaisquer estudos em que você mede os mesmos assuntos várias vezes. Por exemplo, em um estudo de dieta e peso, você pode medir cada pessoa várias vezes. Esses dados não são independentes porque o que uma pessoa pesa em uma ocasião está relacionado ao que ela pesa em outras ocasiões. Uma maneira de lidar com isso é com modelos multiníveis.

As vantagens da regressão linear

Os desafios diários de administrar uma pequena empresa podem ser assustadores o suficiente sem tentar prever o futuro, mas os gerentes e proprietários devem ficar de olho no futuro enquanto operam suas empresas. A análise de regressão, uma técnica de análise estatística usada por economistas e pesquisadores de negócios, ajuda gerentes e donos de empresas a prever condições futuras, dar suporte quantitativo ao julgamento dos gerentes, apontar falhas no pensamento gerencial e fornecer novos insights que podem ajudar os tomadores de decisão a mudar seus negócios para um futuro mais lucrativo.

Prever o futuro

Uma das principais vantagens das técnicas de previsão baseadas em regressão é que elas usam pesquisa e análise para prever o que provavelmente acontecerá no próximo trimestre, ano ou até mais longe no futuro, de acordo com AH Studenmund, autor de "Using Econometrics". Para os proprietários de pequenas empresas, a previsão baseada em regressão pode fornecer informações sobre como impostos mais altos, mudanças nos gastos do consumidor ou mudanças na economia local, por exemplo, afetarão suas empresas.

Decisões de apoio

Empresas grandes e pequenas estão inundadas de dados sobre finanças, operações e compras de clientes. Cada vez mais, os gerentes que antes confiavam em sua experiência e intuição buscavam dados e análises para informar as decisões de negócios. As técnicas de regressão e previsão podem dar um ângulo científico ao gerenciamento de pequenas empresas, reduzindo grandes quantidades de dados brutos a informações acionáveis. Em alguns casos, a análise apoiará o sentimento do gerente. Por exemplo, um gerente que acredita na expansão para uma nova instalação aumentará o tráfego de clientes e as vendas poderão encontrar suporte em um modelo de regressão que encontre uma correlação entre o tamanho da instalação e as receitas da empresa.

Corrigindo erros

Embora a previsão e a regressão possam dar suporte empírico à intuição gerencial, essas técnicas também podem corrigir o pensamento gerencial quando as evidências indicam o contrário. Por exemplo, um gerente de loja de varejo pode acreditar que o aumento do número de horas de compras aumentará muito as vendas. Uma análise de regressão, no entanto, pode demonstrar que as horas mais longas não aumentam significativamente as vendas o suficiente para justificar o aumento dos custos operacionais, como o trabalho adicional dos funcionários. Assim como a regressão pode fornecer suporte quantitativo para as decisões, ela também pode mostrar onde a intuição de uma pequena empresa está equivocada.

Novas ideias

Grandes conjuntos de dados têm o potencial de gerar novas informações valiosas sobre pequenas empresas e suas operações. No entanto, os dados não falam por si, tornando a análise necessária.

As técnicas de regressão e previsão podem gerar novos insights para os gerentes, revelando padrões e relacionamentos que eles não haviam percebido ou considerado anteriormente.

Por exemplo, a análise de dados de vendas e compras pode revelar padrões de compra específicos em determinados dias da semana ou em determinadas épocas do ano. Esses insights podem sinalizar a necessidade de garantir que esses produtos estejam em oferta suficiente para esses períodos de alta demanda.

Aplicação de análise de regressão linear em negócios

Regressão é uma ferramenta estatística usada para entender e quantificar a relação entre duas ou mais variáveis. Regressões variam de modelos simples a equações altamente complexas. Os dois principais usos para a regressão nos negócios são previsão e otimização.

Além de ajudar os gerentes a prever coisas como a demanda futura por seus produtos, a análise de regressão ajuda a ajustar os processos de fabricação e entrega.

Noções Básicas de Regressão

Em sua forma mais rudimentar, a análise de regressão é a estimativa da razão entre duas variáveis. Digamos que você queira estimar o crescimento das vendas de carne (MS Growth), com base no crescimento econômico (crescimento do PIB). Se dados anteriores indicam que o crescimento das vendas de carne é cerca de uma vez e meia o crescimento da economia, a regressão seria a seguinte:

Crescimento MS = (crescimento do PIB) 1.5.

A relação entre muitas variáveis ​​também envolve uma constante. Se as vendas de carne estão em alta, crescendo 1% mesmo em uma economia estagnada, a equação seria: Crescimento MS = (Crescimento do PIB) _1,5 +1.

Regressão Múltipla e Não Linear

A variável que você está tentando estimar é referida como dependente, enquanto a variável que você usa no modelo para prever a variável dependente é chamada de independente.

Uma regressão pode ter apenas uma variável dependente. No entanto, o número de variáveis ​​independentes potenciais é ilimitado e o modelo é chamado de regressão múltipla se envolver várias variáveis ​​independentes. Modelos de regressão também podem identificar relações mais complexas entre variáveis.

Às vezes, um modelo usa o quadrado, raiz quadrada ou qualquer outro poder de uma ou mais variáveis ​​independentes para predizer o dependente, o que o torna uma regressão não linear. Por exemplo: MS Growth = 1/2 (raiz quadrada do crescimento do PIB).

Prever o futuro

O uso mais comum de regressão nos negócios é prever eventos que ainda precisam ocorrer. A análise de demanda, por exemplo, prevê quantas unidades os consumidores comprarão.

Muitos outros parâmetros-chave, além da demanda, são variáveis ​​dependentes nos modelos de regressão. Prever o número de compradores que passarão em frente a um determinado outdoor ou o número de espectadores que assistirão ao Super Bowl pode ajudar a gerência a avaliar o que pagar por um anúncio.

As seguradoras dependem muito da análise de regressão para estimar quantos segurados estarão envolvidos em acidentes ou vítimas de assaltos, por exemplo.

Otimização

Outro uso importante dos modelos de regressão é a otimização dos processos de negócios. Um gerente de fábrica pode, por exemplo, construir um modelo para entender a relação entre a temperatura do forno e a vida útil dos biscoitos assados ​​nesses fornos.

Uma empresa que opera um call center pode querer saber a relação entre os tempos de espera dos chamadores e o número de reclamações.

Um impulsionador fundamental da produtividade aprimorada nos negócios e do rápido avanço econômico em todo o mundo durante o século 20 foi o uso frequente de ferramentas estatísticas nas indústrias manufatureiras e de serviços. Hoje, os gerentes consideram a regressão uma ferramenta indispensável.

Virgilio F. M. dos Santos

Virgilio F. M. dos Santos

Sócio-fundador da FM2S, formado em Engenharia Mecânica pela Unicamp (2006), com mestrado e doutorado na Engenharia de Processos de Fabricação na FEM/UNICAMP (2007 a 2013) e Master Black Belt pela UNICAMP (2011). Foi professor dos cursos de Black Belt, Green Belt e especialização em Gestão e Estratégia de Empresas da UNICAMP, assim como de outras universidades e cursos de pós-graduação. Atuou como gerente de processos e melhoria em empresa de bebidas e foi um dos idealizadores do Desafio Unicamp de Inovação Tecnológica.