Teste de Hipótese: o que é e para que serve?

teste de hipótese
26 de outubro de 2018
Última modificação: 26 de outubro de 2018

Autor: Virgilio F. M. dos Santos
Categorias: Seis Sigma

O que é Teste de Hipótese?

Uma hipótese estatística é uma suposição sobre um parâmetro populacional. Essa suposição pode ou não ser verdadeira. O teste de hipóteses refere-se aos procedimentos formais usados ​​pelos estatísticos para aceitar ou rejeitar hipóteses estatísticas.

Teste de Hipótese Estatística

A melhor maneira de determinar se uma hipótese estatística é verdadeira seria examinar toda a população. Como isso costuma ser impraticável, os pesquisadores geralmente examinam uma amostra aleatória da população. Se os dados da amostra não forem consistentes com a hipótese estatística, a hipótese é rejeitada.

Existem dois tipos de hipóteses estatísticas.

  • Hipótese nula. A hipótese nula, denotada por H o , é geralmente a hipótese de que as observações da amostra resultam puramente do acaso.
  • Hipótese alternativa. A hipótese alternativa, denotada por H 1 ou H a , é a hipótese de que as observações da amostra são influenciadas por alguma causa não aleatória.

Por exemplo, suponha que queríamos determinar se uma moeda era justa e equilibrada. Uma hipótese nula pode ser que metade dos flips resultaria em Heads e half, em Tails. A hipótese alternativa poderia ser que o número de caras e caudas seria muito diferente. Simbolicamente, essas hipóteses seriam expressas como:

o : P = 0,5
a : P ≠ 0,5

Suponha que nós jogamos a moeda 50 vezes, resultando em 40 caras e 10 caudas. Dado este resultado, estaríamos inclinados a rejeitar a hipótese nula. Concluiríamos, com base nas evidências, que a moeda provavelmente não era justa e equilibrada.

Podemos aceitar o Teste de Hipótese Nula?

Alguns pesquisadores dizem que um teste de hipótese pode ter um de dois resultados: você aceita a hipótese nula ou rejeita a hipótese nula. Muitos estatísticos, no entanto, discordam da noção de “aceitar a hipótese nula”. Em vez disso, eles dizem: você rejeita a hipótese nula ou não rejeita a hipótese nula.

Por que a distinção entre “aceitação” e “falha em rejeitar?” Aceitação implica que a hipótese nula é verdadeira. Não rejeitar implica que os dados não são suficientemente persuasivos para que possamos preferir a hipótese alternativa à hipótese nula.

teste de hipótese

 

Testes de Hipóteses

Os estatísticos seguem um processo formal para determinar se rejeitam uma hipótese nula, baseada em dados de amostra. Esse processo, chamado de teste de hipótese, consiste em quatro etapas.

  • Indique as hipóteses. Isso envolve declarar as hipóteses nula e alternativa. As hipóteses são apresentadas de tal maneira que são mutuamente exclusivas. Isto é, se uma for verdadeira, a outra deve ser falsa.
  • Formule um plano de análise. O plano de análise descreve como usar dados de amostra para avaliar a hipótese nula. A avaliação geralmente se concentra em torno de uma única estatística de teste.
  • Analise dados de amostra. Encontre o valor da estatística de teste (escore médio, proporção, estatística t, escore z, etc.) descrito no plano de análise.
  • Interpretar resultados. Aplique a regra de decisão descrita no plano de análise. Se o valor da estatística de teste for improvável, com base na hipótese nula, rejeite a hipótese nula.

Erros de decisão

Dois tipos de erros podem resultar de um teste de hipótese:

  • Tipo I de erro. Um erro do Tipo I ocorre quando o pesquisador rejeita uma hipótese nula quando é verdadeira. A probabilidade de cometer um erro do tipo I é chamada de nível de significância. Essa probabilidade também é chamada de alfa e é frequentemente denotada por α.
  • Erro de tipo II. Um erro do tipo II ocorre quando o pesquisador não rejeita uma hipótese nula que é falsa. A probabilidade de cometer um erro do Tipo II é chamada Beta e é frequentemente denotada por β. A probabilidade de não cometer um erro do tipo II é chamada de poder do teste.

Regras de decisão

O plano de análise inclui regras de decisão para rejeitar a hipótese nula. Na prática, os estatísticos descrevem essas regras de decisão de duas maneiras – com referência a um valor P ou com referência a uma região de aceitação.

  • Valor P. A força de evidência em apoio de uma hipótese nula é medida pelo valor P. Suponhamos que a estatística de teste é igual a S . O valor P é a probabilidade de se observar uma estatística de teste tão extrema quanto S , assumindo que a hipótese hipotética é verdadeira. Se o valor P for menor que o nível de significância, rejeitamos a hipótese nula.
  • Região de aceitação. A região de aceitação é um intervalo de valores. Se a estatística de teste estiver dentro da região de aceitação, a hipótese nula não será rejeitada. A região de aceitação é definida de modo que a chance de fazer um erro Tipo I seja igual ao nível de significância.

O conjunto de valores fora da região de aceitação é chamado de região de rejeição. Se a estatística de teste estiver dentro da região de rejeição, a hipótese nula é rejeitada. Em tais casos, dizemos que a hipótese foi rejeitada no nível de significância α.

Essas abordagens são equivalentes. Alguns textos estatísticos usam a abordagem do valor P, outros usam a abordagem da região de aceitação. Neste site, tendemos a usar a abordagem da região de aceitação.

 

Testes de uma cauda e duas caudas

Um teste de uma hipótese estatística, em que a região de rejeição está em apenas um lado da distribuição amostral, é chamado de teste unicaudal. Por exemplo, suponha que a hipótese nula afirma que a média é menor ou igual a 10. A hipótese alternativa seria que a média é maior que 10. A região de rejeição consistiria em uma faixa de números localizada no lado direito da amostragem distribuição, isto é, um conjunto de números maior que 10.

Um teste de uma hipótese estatística, em que a região de rejeição está em ambos os lados da distribuição amostral, é chamado de teste bicaudal. Por exemplo, suponha que a hipótese nula afirma que a média é igual a 10. A hipótese alternativa seria que a média é menor que 10 ou maior que 10. A região de rejeição consistiria em uma faixa de números localizados em ambos os lados da amostragem, distribuição, isto é, a região de rejeição consistiria em parte de números menores que 10 e parcialmente de números maiores que 10.

Deixe seu comentário

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

14 + 14 =