O que é Anova e como aplicá-la? – FM2S

anova
07 de março de 2017
Última modificação: 07 de março de 2017

Autor: Virgilio F. M. dos Santos
Categorias: Blog, Seis Sigma

O que é Anova?

Anova ou Análise de variância é a técnica estatística que permite avaliar afirmações sobre as médias de populações. O objetivo da técnica é analisar se existe uma diferença significativa de um ou mais fatores (também chamados de variáveis de entrada, ou variáveis X) comparando as médias das variáveis de resposta em diferentes níveis dos fatores.

A hipótese nula afirma que todas as médias das populações (médias dos níveis dos fatores) são iguais, enquanto a hipótese alternativa afirma que pelo menos uma é diferente.

Como realizar uma anova?

Para realizar a ANOVA, você precisará de uma variável de resposta contínua e pelo menos um fator categórico com dois ou mais níveis. As análises ANOVA exigem dados de populações que sigam a distribuição normal e cujas sejam variâncias iguais entre fatores. Porém, para nossa sorte, os procedimentos ANOVA funcionam bem mesmo quando a pressuposição de normalidade é violada, havendo uma exceção quando uma ou mais distribuições são altamente assimétricas ou quando as variâncias são muito diferentes. Nesses casos, recomenda-se lançar mão de uma transformação de variáveis para corrigir essas violações.

Por exemplo, pois é com exemplos que aprendemos, imagine que uma loja gostaria de testar se o valor gasto na compra pelo cliente, sofre influência de alguns fatores. Dentre os fatores, o lojista a loja e coloca 3 níveis (loja A, loja B e loja C). O Anova, vai permitir que o lojista avalie se há diferenças estatisticamente significativas entre os tratamentos ou se o resultado observado variou em decorrência da mera variabilidade amostral.

Nossa experiência, diz que costumamos superestimar a variação e o sucesso de alguns tratamentos e, o ANOVA vai lhe proteger disso. E como realizar a sua análise? Mostramos isso em detalhes em nossa Certificação Green Belt utilizando o software Minitab. Lá, é muito fácil realizar esse estudo e, você conta ainda com um assistente para montar e analisar os resultados (o assistente está disponível a partir da versão 17).

Como surgiu o ANOVA?

O nome baseia-se na abordagem na qual se utiliza as variâncias para determinar se as médias são diferentes. O procedimento compara a variância entre as médias do grupo à variância dentro dos grupos, para determinar se os grupos são todos parte de uma população maior ou populações separadas com características diferentes.

Se a variância dentro de uma população for maior do que a variância observada entre os grupos, então conclui-se que todas os fatores pertencem a mesma população. Nesse caso, a variação observada entre os tratamentos deu-se apenas devido a variabilidade amostral. Isso, em projetos de melhoria que você trabalha quase como que um Sherlock Holmes, é algo frustrante.

O termo análise de variância aparece pela primeira vez em 1924, no artigo “Estudos da variação de safras II”, de Ronald Fisher. Nesse estudo, Fisher cria uma das mais importantes ferramentas da ciência biológica: um método para separar os efeitos de diferentes tratamentos em um experimento bem planejado.

Como interpretar os resultados da ANOVA?

O ANOVA utiliza várias abordagens matemáticas para comparar as médias das amostras, mas antes de sair aplicando, deve-se formular as hipóteses da seguinte maneira:

  • A hipótese nula é: não há diferença entre o valor médio das transações entre as lojas.
  • A hipótese alternativa: há diferença, em pelo menos uma loja em que a média do valor das transações é diferente.

Com a hipótese, podemos partir para a aplicação da ferramenta aos dados e por fim, avaliar o resultado da análise.

O primeiro item, a ser analisado, é o p-valor. Se o p-valor, por exemplo, foi de 0.000 é sinal de que há diferença entre as lojas. Entretanto, devemos tomar cuidado em como formularemos nossas conclusões, porque haver diferença não é a mesma coisa de “todos são diferentes”.

Se a análise for feita no Minitab, ele também resume as estatísticas chave de cada subgrupo, informando o intervalo de confiança (95%) para a média de cada subgrupo. Tais intervalos, são úteis para entendermos quais subgrupos são diferentes, o que fica mais fácil, pois são feitos por meio do “Interval Plot”. Por meio desse gráfico, é possível ver qual o intervalo para cada uma das lojas.

Quando você vai precisar usar ANOVA?

Se você está lidando com indivíduos, é provável que você encontre essa situação usando dois tipos diferentes de planejamento de estudo:

Um projeto de estudo é recrutar um grupo de indivíduos e, em seguida, dividir aleatoriamente esse grupo em três ou mais grupos menores (ou seja, cada participante é alocado para um, e apenas um, grupo). Você então faz com que cada grupo realize diferentes tarefas (ou as coloque sob condições diferentes) medindo o resultado/resposta na mesma variável dependente. Por exemplo, um pesquisador deseja saber se diferentes estratégias de ritmo afetam o tempo para completar uma maratona. O pesquisador atribui aleatoriamente um grupo de voluntários a um grupo que (a) começa devagar e depois aumenta sua velocidade, (b) começa rápido e desacelera ou (c) corre em um ritmo constante. O tempo para completar a maratona é a variável de resultado (dependente).

Um segundo desenho de estudo é recrutar um grupo de indivíduos e depois dividi-los em grupos baseados em alguma variável independente. Mais uma vez, cada indivíduo será atribuído a apenas um grupo. Essa variável independente às vezes é chamada de variável independente de atributo porque você está dividindo o grupo com base em algum atributo que possui (por exemplo, seu nível de instrução; cada indivíduo tem um nível de instrução, mesmo que seja “nenhum”). Cada grupo é então medido na mesma variável dependente que passou pela mesma tarefa ou condição (ou nenhuma). Por exemplo, um pesquisador está interessado em determinar se há diferenças na força das pernas entre jogadores de rugby amadores, semiprofissionais e profissionais. A força / força medida em uma máquina isocinética é a variável dependente.

Por que não comparar grupos com vários testes t?

Toda vez que você realizar um teste t, há uma chance de que você faça um erro do Tipo I. Este erro geralmente é de 5%. Ao executar dois testes-t nos mesmos dados, você aumentará sua chance de “cometer o erro” para 10%. A fórmula para determinar a nova taxa de erro para múltiplos testes t não é tão simples quanto multiplicar 5% pelo número de testes. No entanto, se você estiver fazendo apenas algumas comparações múltiplas, os resultados serão muito semelhantes se você fizer isso. Como tal, três testes t seriam 15% (na verdade, 14,3%) e assim por diante. Estes são erros inaceitáveis. Um ANOVA controla esses erros para que o erro Tipo I permaneça em 5% e você pode ter mais confiança de que qualquer resultado estatisticamente significativo encontrado não está apenas executando muitos testes. Consulte o nosso guia de testes de hipóteses para obter mais informações sobre erros do tipo I.

ANOVA

ANOVA: algumas definições importantes

O que significa ANOVA “unidirecional” ou “bidirecional”?

Uma forma ou duas vias refere-se ao número de variáveis ​​independentes (IVs) em seu teste Análise de Variância. Um caminho tem uma variável independente (com dois níveis ) e duas vias tem duas variáveis ​​independentes (pode ter vários níveis). Por exemplo, uma Análise de Variância unidirecional pode ter um IV (marca de cereal) e uma Análise de Variância de duas vias tem dois IVs (marca de cereal, calorias).

O que são “Grupos” ou “Níveis” no ANOVA?

Grupos ou níveis são grupos diferentes na mesma variável independente . No exemplo acima, seus níveis para “marca de cereal” podem ser Lucky Charms, Raisin Bran, Cornflakes – um total de três níveis. Seus níveis para “Calorias” podem ser: adoçados, sem açúcar – um total de dois níveis.

Digamos que você esteja estudando se o Alcoholic Anonymous e o aconselhamento individual combinados forem o tratamento mais eficaz para diminuir o consumo de álcool. Você pode dividir os participantes do estudo em três grupos ou níveis: somente medicação, medicação e aconselhamento, e apenas aconselhamento. Sua variável dependente seria o número de bebidas alcoólicas consumidas por dia.

Se seus grupos ou níveis tiverem uma estrutura hierárquica (cada nível tem subgrupos exclusivos), use uma ANOVA aninhada para a análise.

O que significa “replicação” no ANOVA?

É se você está replicando seu (s) teste (s) com vários grupos. Com uma ANOVA bidirecional com replicação , você tem dois grupos e os indivíduos dentro desse grupo estão fazendo mais de uma coisa (ou seja, dois grupos de alunos de duas faculdades fazendo dois testes). Se você tiver apenas um grupo fazendo dois testes, você usaria sem replicação.

Quais os tipos de testes ANOVA?

Existem dois tipos principais: unidirecional e bidirecional. Os testes de duas vias podem ser com ou sem replicação.

  • One-way ANOVA entre grupos: usado quando você quer testar dois grupos para ver se há uma diferença entre eles.
  • Two way ANOVA sem replicação: usado quando você tem um grupo e você está testando o mesmo grupo. Por exemplo, você está testando um conjunto de indivíduos antes e depois de tomar um medicamento para ver se funciona ou não.
  • Two way ANOVA com replicação: Dois grupos , e os membros desses grupos estão fazendo mais de uma coisa . Por exemplo, dois grupos de pacientes de diferentes hospitais que tentam duas terapias diferentes.

Quer saber mais sobre análise de dados?

Veja nosso MEGA-POST sobre análise de dados. Lá você vai conhecer deste essas ferramentas mais complexas, como é o caso da anova, até ferramentas mais simples, que é o caso das ferramentas da qualidade.

Deixe seu comentário

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *