Você sabe o que é a ANOVA? Ou talvez o que é uma análise de variância? Sabe para que serve ou como fazer? Se respondeu não para alguma dessas questões, continue lendo este post para descobrir.

A Análise de Variância é também conhecida como ANOVA e nada mais é do que um tipo de teste de hipótese, o mais utilizado deles, é verdade, e por isso hoje decidi escrever sobre ele. Vamos lá?

 

Assista gratuitamente nossa vídeo-aula sobre ANOVA

 


 

O que é ANOVA?

 

A ANOVA, análise de variância, tem como objetivo comparar a média de população amostral, e assim identificar se essas médias diferem significativamente entre elas. Ou seja, uma proposta bem parecida com os demais testes de hipóteses.

A diferença básica entre os testes de hipótese e a análise de variância é o número de amostras. Enquanto nos testes de hipótese se trabalha com duas amostras, a ANOVA compara a média de mais de duas amostras e determina se ao menos uma se difere significativamente das demais.

 

Quando utilizar a ANOVA?

 

Existem inúmeras ferramentas estatísticas, não é mesmo? Então, como saberemos quando utilizar cada uma delas? A resposta é simples: a escolha se baseia no tipo de amostra que sua base de dados possui.

Na figura abaixo está representado um mapa de análise estatística que indica qual ferramenta quantitativa é a mais indicada para cada par entrada-saída de dados que será estudado.     

 

 

Esse mapa deve ser utilizado no início da fase de análise do método DMAIC a fim de comprovar com fatos e dados a relação entre as causas raiz (X´s vitais) e as saídas de interesse do processo (variáveis Y´s).

Respondendo à pergunta principal deste tópico, utilizaremos a ANOVA sempre que a variável de entrada X for discreta e a variável de saída Y contínua, ou seja, no quadrante superior direito deste mapa.

Para ficar bem claro esse conceito e quando utilizar, separei aqui dois tipos de exemplos. No primeiro deles vou te explicar como realizar as operações do teste ANOVA manualmente. Enquanto que no segundo exemplo vou te explicar como fazer isso utilizando o software Minitab.

 

ANOVA - Exemplo manual

 

A Voitto Computadores, produz impressoras e máquinas de fax em suas fábricas localizadas em Juiz de Fora, Belo Horizonte e Rio de Janeiro.

 

Para medir quanto os empregados dessas fábricas sabem sobre gerenciamento da qualidade total, uma amostra aleatória de seis empregados de cada fábrica foi selecionada e seus integrantes foram submetidos a um exame de seus conhecimentos sobre qualidade.

 

As notas do exame obtidas estão na tabela abaixo.

 

 

Os gerentes querem usar esses dados para testar a hipótese de que a média das

notas de exame é a mesma para todas as 3 fábricas.

 

Para isso, primeiramente temos que definir quais serão as hipóteses nula e alternativa, certo? Então vamos lá:

 

A hipótese nula é de que todas as três fábricas possuem média significativamente iguais e a hipótese alternativa é de que pelo menos uma delas têm médias significativamente diferente das demais.

 

Feito isso, iremos calcular os valores da média para cada amostra bem como os valores de variância amostral. Depois disso, faremos também o cálculo da média global. Os dados são apresentados na tabela a seguir:

 

 

Temos agora que utilizar tais valores para calcular os quadrados médios entre os tratamentos e o quadrado médio do erro, com base nas fórmulas a seguir.

 

 

Onde g é o graus de liberdade, que nesse caso vale 3, pois temos 3 amostras, e N é a quantidade total de dados que possuímos, que nesse caso possui valor igual a 18. E F é o valor que iremos comparar com os dados tabelados.

 

Realizando tais operações encontramos os seguintes resultados.

 

 

Chegamos agora a um momento crucial da nossa análise, vamos comparar o valor F obtido com o valor tabelado.

 

Para encontrar o valor na tabela, basta utilizarmos a tabela de distribuição F para um nível de confiança de 5%, com os dados g - 1 = 3-1 = 2 no numerador e N - g = 18 - 3 = 15 no denominador, e dessa forma iremos encontrar o valor crítico de 3,68.

 

Como o nosso valor calculado F = 9 é maior do que o valor crítico de 3,68, nos encontramos na área de rejeição da hipótese nula.

 

 

Ou seja, rejeitamos a hipótese de que as médias das notas de todas as filiais da Voitto Computadores são significativamente iguais.

 

Agora já sabemos calcular manualmente a ANOVA, certo? Porém, como deve ter reparado, é trabalhoso e não é trivial. Pensando nisso, também vou te explicar como realizar um teste de ANOVA em um dos softwares mais utilizados para análises estatísticas. Vamos lá?

 

ANOVA - Exemplo no Minitab

 

Na Voitto Labs, o layout na área de produção é separado em quatro linhas: Verde, Azul, Vermelha e Amarela. A Linha Vermelha, por exemplo, recebe os tubos coletados para exames hematológicos e a Linha Azul recebe os tubos coletados para exames parasitológicos e de uroanálise.

O Green Belt fará uma análise de variância para determinar se o desempenho médio das linhas é igual ou se pelo menos uma linha possui desempenho significativamente diferente das outras.

De forma análoga ao procedimento dos testes de hipóteses, o primeiro passo é determinar qual será a hipótese nula e qual será a hipótese alternativa. para este exemplo, iremos adotar as seguintes hipóteses:

 

  • H0: Linha Verde = Linha Azul = Linha Amarela = Linha Vermelha
  • Ha: pelo menos um desempenho médio é significativamente diferente

 

Após a coleta de dados, e posterior inserção destes no software, vá ao menu stat, selecione ANOVA para um fator. Selecione a opção referente à distribuição dos seus dados e clique em OK.

A regra de decisão deste teste será:

 

  • Se p-valor < α, Rejeitar H0
  • Se p-valor > α, Não rejeitar H0

 

Onde α = 0,05 (5%) é o nível de significância do teste.

Em opções, é importante verificar se estão sendo assumidas variâncias iguais, pois existe essa pré definição de que cada resultado de cada linha de produção deve ter uma variabilidade similar.

Com isso se consegue fazer uma análise do patamar médio de cada uma das amostras e assim realmente comparar se este patamar médio de pelo menos uma das linhas de produção é significativamente diferente.

Dessa forma, se gera o seguinte gráfico:

 

 

Com esse gráfico, já se torna possível verificar que a linha amarela e a linha verde possuem resultados significativamente inferiores às linhas azul e vermelha. Porém, esse resultado é bastante subjetivo.

E, por esse motivo iremos buscar na tela Session um resultado numérico para termos certeza dessa análise. Como apresentado a seguir.

 

 

Como o p-valor é igual a zero, ou seja, menor do que α, deve-se rejeitar a hipótese nula e aceitar a hipótese alternativa. Ou seja, realmente concluímos que pelo menos uma Linha de produção possui média significativamente diferente.

 

ANOVA - Saiba mais

 

Agora que você já sabe o que é, para que serve e como calcular a ANOVA, tanto manualmente quanto com auxílio de um software, que tal aprender um pouco mais sobre a fase de análise do método DMAIC e aprimorar suas análises estatísticas?

 

Essa e todas as outras etapas do método mais usado na metodologia Lean Seis Sigma você encontra no curso de Black Belt em Lean Seis Sigma.

 

Além disso, assim como a ANOVA, existem vários outros métodos de análise estatística, e o domínio dessas ferramentas fazem parte das competências de um Black Belt.

 

Então não espere mais para dar o passo que sua carreira estava precisando e se torne um dos profissionais mais capacitados do mercado!

 

 

E aí? O que achou desse post? Conta para a gente e nos ajude a melhorar ainda mais nossos conteúdos. Seu feedback é importante para nós!