Tenho certeza que na frase regressão linear simples no excel, as duas primeiras palavras podem assustar, e a parte mais tranquilizadora é a palavra simples, não é mesmo?

Essa palavra tanto indica que vamos fazer a regressão linear mais fácil de ser obtida, como você também pode ter certeza que ela expressa como será tranquilo fazer tudo isso no Excel!

Então, continue lendo para aprender como fazer uma regressão linear simples no Excel, assim como avaliar se obteve um bom resultado, e o que isso significa. Vamos lá?

 

Coletando Dados

 

O primeiro passo de uma regressão é a coleta de dados. No caso da regressão linear simples, teremos apenas duas variáveis:

  • Váriavel X: variável independente.
  • Variável Y: variável dependente.

 

Para o nosso exemplo, nós vamos trabalhar com um exemplo foi pesquisado o consumo médio familiar de várias famílias dos Estados Unidos, com base em valores crescentes de renda, ou seja, com X dólares, quantos Y dólares elas consumiam.

 

 

Habilitando a Análise de Dados

 

Após coletar e organizar os dados, é necessário elaborar a análise dos dados. Existem duas maneiras de se fazer isto, uma via gráfico de dispersão e outra mais completa, utilizando o módulo de análise de dados do Excel.

Utilizaremos a Análise de Dados, então é necessário descobrir se essa opção já está habilitada em seu software. Para isso, basta clicar na aba Dados, e ver se aparece a opção desejada no canto direito superior, como mostra na imagem:

 

 

Caso essa opção não esteja habilitada, basta você clicar em Arquivos > Opções > Suplementos > Ir... e então você deve selecionar as 2 opções marcadas na imagem:

 

 

Dessa forma, a opção de Análise de Dados aparecerá e você estará pronto para começar!

 

Elaborar a análise de dados

 

Para começar a análise, basta clicar em análise de dados e aparecerá a seguinte janela:

 

 

Basta selecionar Regressão como mostra na imagem, e outra janela será aberto.

 

 

Para continuar basta colocar o cursor como na imagem acima e selecionar o intervalo de Y e o intervalo de X que deseja analisar. Primeiramente iremos analisar a tabela da esquerda, ou seja, você deve selecionar para Y e para X os seguintes intervalos:

 

 

Antes de clicar em Ok e obter sua regressão linear no excel, você deve selecionar o nível de confiança para 95%, pois um erro de 5% é uma boa estimativa na estatística.

Você pode alocar os dados de sua análise tanto em uma nova planilha, como está selecionado na imagem acima, como na mesma planilha. Para o nosso exemplo, manteremos a opção nova planilha selecionada.

Selecione também a opção de resíduos, plotar resíduos, plotagem de probabilidade e plotar ajuste de linha, pois elas nos auxiliarão em nossas análises. A janela ficará como na imagem abaixo:

 

 

Ao clicar em Ok, você verá os seguintes dados em sua nova planilha:

 

 

Fazendo uns ajustes visuais, podemos deixar a planilha da seguinte forma:

 

 

Como saber se essa regressão linear faz sentido?

 

Não basta somente fazer a regressão linear simples no excel, temos que avaliar para ver se essa regressão tem sentido. Afinal, algumas questões vêm à tona e precisam ser respondidas, como:

  • A equação é realmente adequada para o tipo de correlação existente entre as duas variáveis?
  • O modelo obtido será útil para realizar predições?

 

Assim, para podermos responder essas perguntas e concluir se o modelo de regressão linear é adequado, devemos avaliar três pontos:

  • P-valor da regressão: define se existe correlação entre as variáveis;
  • Análise de resíduos: define se a equação é realmente adequada;
  • Coeficiente de determinação (R²): define a representatividade da variável x para explicar o comportamento da variável y.

 

Analisando esses 3 pontos da regressão linear simples conseguimos perceber se o modelo é adequado para tal estudo. Então vamos começar?

 

P-valor da regressão

 

A regra de decisão aqui é a seguinte:

  • p-valor < 0,05 – a correlação entre as duas variáveis é significativa.
  • p-valor > 0,05 – a correlação entre as duas variáveis não é significativa

 

Para o nosso exemplo, podemos ver que o p-valor é 0,005142172, ou seja, a correlação entre as duas variáveis é significativa:

 

 

Análise de Resíduos

 

A análise mais simples de fazer nessa etapa é verificar se o Y previsto e o Y real estão muito distantes ou não. Essa diferença entre o real e o previsto é justamente o resíduo, e se ele aumentar a medida que os valores de X aumentam, significa que algo está errado.  

 

 

Como você pode ver, os resíduos não aumentam com o crescimento de X, então podemos passar para o próximo passo.

Outro gráfico que podemos analisar é o de plotagem de probabilidade, que serve para avaliarmos se a distribuição dos resíduos é uma curva normal ou se é necessário transformar as variáveis. Como nosso gráfico de probabilidade é próximo de uma reta, podemos concluir que a distribuição dos resíduos é normal.

 

 

Coeficiente de determinação (R²)

 

Nessa etapa temos a seguinte regra de decisão:

  • O coeficiente será calculado como 0 < R² < 100%.
  • Quanto mais próximo de 100%, maior a representatividade da variável x ao explicar o comportamento da variabilidade que ocorre com a variável y, sendo ideal um acima de 50%.               

 

No nosso exemplo, temos o seguinte valor para o coeficiente de determinação:

 

 

Transformando para porcentagem, temos que a variável X tem 96,21% de impacto sobre a variável Y, o que é uma ótima influência.

 

Entendeu o processo de análise?

 

Tão importante quanto fazer a regressão linear simples no Excel é saber se o resultado obtido é coerente. Afinal, se não existir uma correlação entre as variáveis, não faz sentido utilizar essa ferramenta estatística.

No exemplo que fizemos todos os critérios foram atendidos, logo, é possível utilizar a regressão linear simples para estudar o seu processo em si. Porém, muitas vezes a regressão linear não é um bom modelo, e torna-se necessário utilizar ferramentas mais complexas! E nesse caso, o que fazer?

É simples! Basta você se inscrever no nosso curso de Green Belt em Lean Seis Sigma e você verá inúmeras ferramentas que poderão te auxiliar a fazer análises estatísticas cada vez mais profundas! Então não perca tempo, se inscreva agora e amplie seus horizontes!