fbpx

Categoria: Blog

Teste de hipóteses para a razão de duas variâncias (Teste F)

Marcelo Toledo • 10/01/2020 • 6 anos atrás

No contexto de projetos Lean Seis Sigma, a comparação da variabilidade entre processos, materiais ou condições operacionais é recorrente. Sob a suposição de normalidade e independência, essa comparação é tradicionalmente realizada por meio do teste de hipóteses para a razão de duas variâncias ou teste F, fundamentado na distribuição F (Montgomery, 2013).

Problema e hipóteses

Considere duas populações normais e independentes, com médias desconhecidas μ1 e μ2, e variâncias σ12 = σ22. A partir de duas amostras aleatórias de tamanhos n1 e n2, com variâncias amostrais S12 e S22, deseja-se testar, por exemplo:

  • Hipótese nula (igualdade de variâncias):

H0: σ12 = σ22

  • Hipótese alternativa (teste bilateral):

H1: σ12 ≠ σ22

Também são comuns alternativas unilaterais, quando existe uma afirmação direcional:

  • H1: σ12 > σ22

(a variância do processo 1 é maior que a do processo 2)

  • H1: σ12 < σ22

(a variância do processo 1 é menor que a do processo 2)

Qual distribuição é requerida?

Para desenvolver o procedimento de teste para a razão de duas variâncias, utiliza-se a distribuição F (Montgomery, 2013).

A justificativa é a seguinte: se as amostras vêm de populações normais e independentes, então as quantidades

(n11)S12σ12e(n21)S22σ22\frac{(n_1-1)S_1^2}{\sigma_1^2} \quad \text{e} \quad \frac{(n_2-1)S_2^2}{\sigma_2^2}

seguem distribuições qui-quadrado com n1 – 1 e n2 – 1 graus de liberdade, respectivamente. A razão apropriada desses termos resulta em uma variável aleatória com distribuição F (Montgomery; Runger, 2014).

Em particular:

S12/σ12S22/σ22F(n11, n21)\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F_{(n_1-1,\ n_2-1)}

Estatística de teste (Teste F)

Sob H0: σ12 = σ22, a estatística de teste é:

f0=S12S22f_0 = \frac{S_1^2}{S_2^2}

com:

  • Graus de liberdade do numerador:

v1=n11v_1 = n_1 – 1

  • Graus de liberdade do denominador:

v2=n21v_2 = n_2 – 1

Observação prática (muito importante): em aplicações, é comum colocar a maior variância no numerador para trabalhar com f0 ≥ 1 e simplificar a leitura (especialmente em testes unilaterais à direita). Se fizer isso, ajuste a hipótese alternativa de forma consistente com a sua pergunta.

Regiões de rejeição

Fixado o nível de significância α, os critérios clássicos são:

Teste bilateral

H1: σ12σ22H_1:\ \sigma_1^2 \neq \sigma_2^2

Rejeitar H0 se:

f0>Fα/2, v1, v2ouf0<F1α/2, v1, v2f_0 > F_{\alpha/2,\ v_1,\ v_2} \quad \text{ou} \quad f_0 < F_{1-\alpha/2,\ v_1,\ v_2}

Teste unilateral à direita

H1: σ12>σ22H_1:\ \sigma_1^2 > \sigma_2^2

Rejeitar H0 se:

f0>Fα, v1, v2f_0 > F_{\alpha,\ v_1,\ v_2}

Teste unilateral à esquerda

H1: σ12<σ22H_1:\ \sigma_1^2 < \sigma_2^2

Rejeitar H0 se:

f0<F1α, v1, v2f_0 < F_{1-\alpha,\ v_1,\ v_2}

 

Figura 1: Regiões de rejeição no teste F para comparação de duas variâncias (teste bilateral). Fonte: Elaborada pelo autor.

Por que usar o teste de duas variâncias?

O teste F é utilizado para avaliar se duas amostras apresentam variabilidades estatisticamente diferentes, o que é útil em situações como:

  • comparação de variabilidade antes vs. depois de uma melhoria;

  • avaliação entre dois fornecedores (consistência do material);

  • comparação entre dois equipamentos ou duas linhas;

  • verificação de homocedasticidade como premissa em alguns modelos estatísticos.

Exemplo aplicado

Dados:

  • Cerâmica A: n1 = 11, x1 = 18,42, s1 = 2,77
  • Cerâmica B: n2 = 10, x2 = 19,28, s2 = 2,41

Pergunta: há evidência para afirmar que a cerâmica A tem variabilidade maior do que a B? Nível de significância: α = 0,05.

1) Definição correta das hipóteses (pela pergunta)

Como a afirmação é direcional (“A tem variância maior”), o mais coerente é um teste unilateral:

H0: σ12=σ22vs.H1: σ12>σ22H_0:\ \sigma_1^2 = \sigma_2^2 \quad \text{vs.} \quad H_1:\ \sigma_1^2 > \sigma_2^2

(Se você optar por teste bilateral, ele responde outra pergunta: “são diferentes?”, não necessariamente “A é maior”.)

2) Estatística de teste

S12=2,772=7,6729;S22=2,412=5,8081S_1^2 = 2{,}77^2 = 7{,}6729 \quad;\quad S_2^2 = 2{,}41^2 = 5{,}8081

 

f0=7,67295,80811,321f_0=\frac{7{,}6729}{5{,}8081}\approx 1{,}321

 

Graus de liberdade: v1 = 10 e v2 = 9

3) Decisão (via p-valor / software)

Pela saída do Minitab® (p-valor = 0,686), como p-valor > 0,05, não rejeitamos H0. Logo, não há evidência estatística suficiente para concluir que a cerâmica A possui variabilidade maior do que a cerâmica B, ao nível de 5% de significância.

Figura 2: Áreas de não rejeição e rejeição no teste F para duas variâncias. Fonte: Elaborada pelo autor.

Uma forma mais simples: fazendo no Minitab®

Se você já compreende a lógica do teste (hipóteses, estatística, α, decisão por p-valor), o Minitab® automatiza o cálculo.

Passo a passo (dados sumarizados):

  1. Ao realizar a seleção conforme ilustrado na Figura 3, o software abre a caixa de diálogo exibida na Figura 4.

Teste de igualdade de variâncias no Minitab

Figura 3: Seleção do teste de duas variâncias no Minitab®. Fonte: Elaborada pelo autor.

 

2. Na lista suspensa, selecione a opção “desvios padrões amostrais”, pois os dados estão apresentados de forma sumarizada. Em seguida, informe o tamanho amostral e o desvio padrão de cada amostra e clique em “OK” para obter os resultados.

Teste de igualdade de variâncias no Minitab

Figura 4: Entrada de dados sumarizados (n e s) para o teste. Fonte: Elaborada pelo autor.

 

3. A Figura 5 apresenta a saída do Minitab® e, com base no p-valor obtido (0,686), não se rejeita a hipótese nula ao nível de significância de 5%, indicando que não há evidência estatística de diferença entre as variâncias.

Figura 5: Saída do Minitab® com p-valor do teste F. Fonte: Elaborada pelo autor.

 

4. Adicionalmente, o Minitab® fornece um gráfico-resumo do teste, que facilita a visualização dos resultados, conforme apresentado na Figura 6.

Figura 6: Gráfico-resumo do teste F gerado pelo Minitab®. Fonte: Elaborada pelo autor.

Premissas e alerta de uso

O teste de hipóteses para a razão de duas variâncias (teste F) é sensível à não normalidade. Portanto, o requisito “as duas populações devem ser normais e independentes” não é um detalhe: ele é central para a validade do teste (Montgomery, 2013; Montgomery; Runger, 2014). Diferentemente do teste F, que é altamente sensível a desvios da normalidade, os testes de Levene e Brown–Forsythe são considerados mais robustos, pois mantêm melhor controle do erro tipo I na presença de distribuições assimétricas ou com outliers.

Referências

MONTGOMERY, D. C. Introduction to Statistical Quality Control. 7. ed. New York: John Wiley & Sons, 2013.

MONTGOMERY, D. C.; RUNGER, G. C. Applied Statistics and Probability for Engineers. 6. ed. New York: John Wiley & Sons, 2014.

Direitos autorais

MINITAB® e todas as outras marcas registradas e logotipos dos produtos e serviços da Empresa são a propriedade exclusiva da Minitab, LLC. Todas as outras marcas referenciadas permanecem como propriedade de seus respectivos proprietários. Acesse minitab.com para obter mais informações. Algumas informações contidas nesta publicação/livro são impressas com a permissão da Minitab, LLC. Todos esses materiais continuam sendo a propriedade exclusiva e de direitos autorais da Minitab, LLC. Todos os direitos reservados.

Salvo indicação ao contrário, todas as imagens foram criadas pelo autor. Quaisquer imagens adicionais ou conteúdo não criado pelo autor são usados com permissão e estão sob a propriedade de direitos autorais de seu respectivo proprietário.



Deixe seu comentário
© 2018 Lean Six Sigma Brasil. Todos Direitos reservados.
Desenvolvido por WF Multimídia