O histograma é um eficiente método gráfico para descrever a distribuição dos dados.
Figura 1 – Exemplo de um histograma de temperatura. Fonte: O autor (2019)
Entretanto, uma amostra grande suficiente (> 50 pontos) é requerida para mostrar a distribuição efetivamente.
Primeiramente os dados são divididos em intervalos chamados bins (caixas). O número de pontos dentro de um bin é contado e barras são desenhadas para cada bin, onde a altura da barra representa a contagem (frequência).
A forma do histograma resultante pode ser usada para avaliar:
Conforme Montgomery (2013) duas unidades produzidas por um processo de fabricação nunca são idênticas.
No entanto, é extremamente difícil observar algum padrão de variabilidade quando os dados de uma determinada medição de qualquer característica de qualidade de um produto são organizados em tabelas.
Uma forma de contornar esse problema é a reorganização dos dados por grandeza em uma distribuição de frequências.
Assim, o gráfico das frequências observadas versus a característica de qualidade do produto medida é chamado de histograma.
De acordo com Lucinda (2010) o histograma é um gráfico de colunas que mostra a distribuição de um conjunto de dados dentro de uma determinada faixa de valores.
Nesse gráfico mostra-se a distribuição dos dados, a tendência central desses valores e a dispersão dos mesmos, conforme ilustrado na figura 2.
Figura 2 – Exemplo de histograma da altura de homens brasileiros. Fonte: O autor (2019)
No estudo da distribuição de um item de controle de interesse associado a um processo, geralmente são utilizados histogramas. No entanto, coletar e registrar um grande volume de dados para, posteriormente, construir um gráfico que represente a distribuição dos dados obtidos é uma duplicação de esforços bastante trabalhosa.
Felizmente, softwares estatísticos calculam automaticamente os intervalos bin e permitem aos usuários revisá-los quando requerido. O número de intervalos pode influenciar o padrão da amostra. Um software muito utilizado nas indústrias é o Minitab®.
Sempre procure por picos duplos ou múltiplos indicando que os dados são de duas ou mais populações (por exemplo, turnos, máquinas, operadores ou fornecedores). Se vários picos são evidentes os dados devem ser estratificados.
Figura 3 – Descrição detalhada de um histograma. Fonte: O autor (2019)
A distribuição normal (formato de sino) ou distribuição de Gauss é um exemplo de distribuição simétrica. Observe que há um único ponto de tendência central e os dados são simetricamente distribuídos sobre o centro.
Alguns processos são naturalmente distorcidos. Essas distribuições não aparecem normalmente distribuídas e podem requerer transformação antes da análise estatística.
Dados que as vezes possuem assimetria negativa são fluxo de caixa, rendimento e força. Os dados que às vezes apresentam assimetria positiva são preços domésticos, salário, tempo de ciclo de entrega e rugosidade superficial.
A seguir são mostradas 4 diferentes distribuições de dados todas com a mesma média, mas com dispersão dos dados significantemente diferentes.
Figura 4 – Diferentes distribuições de dados com a mesma média
Lembrem-se, plotar os dados é sempre recomendado!!!
LUCINDA, M. A. Qualidade: Fundamentos e práticas para cursos de graduação. Rio de Janeiro: Brasport, 2010.
MONTGOMERY, D. C. Introduction to Statistical Quality Control. 7th ed. New York, USA: John Wiley & Sons, 2013.