No contexto de projetos Lean Seis Sigma, a comparação da variabilidade entre processos, materiais ou condições operacionais é recorrente. Sob a suposição de normalidade e independência, essa comparação é tradicionalmente realizada por meio do teste de hipóteses para a razão de duas variâncias ou teste F, fundamentado na distribuição F (Montgomery, 2013).
Considere duas populações normais e independentes, com médias desconhecidas μ1 e μ2, e variâncias σ12 = σ22. A partir de duas amostras aleatórias de tamanhos n1 e n2, com variâncias amostrais S12 e S22, deseja-se testar, por exemplo:
Hipótese nula (igualdade de variâncias):
H0: σ12 = σ22
H1: σ12 ≠ σ22
Também são comuns alternativas unilaterais, quando existe uma afirmação direcional:
(a variância do processo 1 é maior que a do processo 2)
(a variância do processo 1 é menor que a do processo 2)
Para desenvolver o procedimento de teste para a razão de duas variâncias, utiliza-se a distribuição F (Montgomery, 2013).
A justificativa é a seguinte: se as amostras vêm de populações normais e independentes, então as quantidades
seguem distribuições qui-quadrado com n1 – 1 e n2 – 1 graus de liberdade, respectivamente. A razão apropriada desses termos resulta em uma variável aleatória com distribuição F (Montgomery; Runger, 2014).
Em particular:
Sob H0: σ12 = σ22, a estatística de teste é:
com:
Observação prática (muito importante): em aplicações, é comum colocar a maior variância no numerador para trabalhar com f0 ≥ 1 e simplificar a leitura (especialmente em testes unilaterais à direita). Se fizer isso, ajuste a hipótese alternativa de forma consistente com a sua pergunta.
Fixado o nível de significância α, os critérios clássicos são:
Rejeitar H0 se:
Rejeitar H0 se:
Rejeitar H0 se:
Figura 1: Regiões de rejeição no teste F para comparação de duas variâncias (teste bilateral). Fonte: Elaborada pelo autor.
O teste F é utilizado para avaliar se duas amostras apresentam variabilidades estatisticamente diferentes, o que é útil em situações como:
comparação de variabilidade antes vs. depois de uma melhoria;
avaliação entre dois fornecedores (consistência do material);
comparação entre dois equipamentos ou duas linhas;
verificação de homocedasticidade como premissa em alguns modelos estatísticos.
Dados:
Pergunta: há evidência para afirmar que a cerâmica A tem variabilidade maior do que a B? Nível de significância: α = 0,05.
Como a afirmação é direcional (“A tem variância maior”), o mais coerente é um teste unilateral:
(Se você optar por teste bilateral, ele responde outra pergunta: “são diferentes?”, não necessariamente “A é maior”.)
Graus de liberdade: v1 = 10 e v2 = 9
Pela saída do Minitab® (p-valor = 0,686), como p-valor > 0,05, não rejeitamos H0. Logo, não há evidência estatística suficiente para concluir que a cerâmica A possui variabilidade maior do que a cerâmica B, ao nível de 5% de significância.

Figura 2: Áreas de não rejeição e rejeição no teste F para duas variâncias. Fonte: Elaborada pelo autor.
Se você já compreende a lógica do teste (hipóteses, estatística, α, decisão por p-valor), o Minitab® automatiza o cálculo.
Passo a passo (dados sumarizados):

Figura 3: Seleção do teste de duas variâncias no Minitab®. Fonte: Elaborada pelo autor.
2. Na lista suspensa, selecione a opção “desvios padrões amostrais”, pois os dados estão apresentados de forma sumarizada. Em seguida, informe o tamanho amostral e o desvio padrão de cada amostra e clique em “OK” para obter os resultados.

Figura 4: Entrada de dados sumarizados (n e s) para o teste. Fonte: Elaborada pelo autor.
3. A Figura 5 apresenta a saída do Minitab® e, com base no p-valor obtido (0,686), não se rejeita a hipótese nula ao nível de significância de 5%, indicando que não há evidência estatística de diferença entre as variâncias.

Figura 5: Saída do Minitab® com p-valor do teste F. Fonte: Elaborada pelo autor.
4. Adicionalmente, o Minitab® fornece um gráfico-resumo do teste, que facilita a visualização dos resultados, conforme apresentado na Figura 6.

Figura 6: Gráfico-resumo do teste F gerado pelo Minitab®. Fonte: Elaborada pelo autor.
O teste de hipóteses para a razão de duas variâncias (teste F) é sensível à não normalidade. Portanto, o requisito “as duas populações devem ser normais e independentes” não é um detalhe: ele é central para a validade do teste (Montgomery, 2013; Montgomery; Runger, 2014). Diferentemente do teste F, que é altamente sensível a desvios da normalidade, os testes de Levene e Brown–Forsythe são considerados mais robustos, pois mantêm melhor controle do erro tipo I na presença de distribuições assimétricas ou com outliers.
MONTGOMERY, D. C. Introduction to Statistical Quality Control. 7. ed. New York: John Wiley & Sons, 2013.
MONTGOMERY, D. C.; RUNGER, G. C. Applied Statistics and Probability for Engineers. 6. ed. New York: John Wiley & Sons, 2014.
MINITAB® e todas as outras marcas registradas e logotipos dos produtos e serviços da Empresa são a propriedade exclusiva da Minitab, LLC. Todas as outras marcas referenciadas permanecem como propriedade de seus respectivos proprietários. Acesse minitab.com para obter mais informações. Algumas informações contidas nesta publicação/livro são impressas com a permissão da Minitab, LLC. Todos esses materiais continuam sendo a propriedade exclusiva e de direitos autorais da Minitab, LLC. Todos os direitos reservados.
Salvo indicação ao contrário, todas as imagens foram criadas pelo autor. Quaisquer imagens adicionais ou conteúdo não criado pelo autor são usados com permissão e estão sob a propriedade de direitos autorais de seu respectivo proprietário.