A estatística básica é essencial para entender e interpretar dados do nosso dia a dia. Ela permite análises que apoiam decisões importantes em áreas como saúde, economia e tecnologia.
Por exemplo, durante pandemias, a estatística ajuda a:
- Identificar padrões de propagação de doenças.
- Calcular o número médio de pessoas infectadas por contato.
- Criar projeções de cenários futuros para orientar políticas públicas.
No mundo atual, onde dados são o novo petróleo, entender conceitos básicos de estatística é indispensável.
Estatística Básica
Imagine a seguinte situação: você é técnico de basquete e precisa escolher um jogador para fazer o lance livre decisivo do jogo. Qual critério usar? A estatística pode ajudar! Ela fornece dados como a média de pontos por jogo, taxa de conversão em arremessos de três pontos e lances livres. Essas informações são cruciais para uma decisão embasada e assertiva.
No Lean Seis Sigma, a estatística é uma ferramenta essencial. Essa metodologia utiliza dados para melhorar a qualidade de produtos, serviços e processos. Além disso, conceitos básicos de estatística são amplamente aplicados por Yellow Belts, Green Belts e Black Belts.
Agora, imagine um caso real: uma máquina de corte de chapas de aço. O controle de qualidade estatístico analisa o número de cortes corretos realizados pela máquina. Defeitos são minimizados, e a qualidade do processo é elevada.
Entender os fundamentos da estatística básica é essencial para quem busca melhorar processos e tomar decisões mais eficazes. Vamos explorar juntos esses conceitos!
O que são variáveis estatísticas? Definições, tipos e exemplos
As variáveis estatísticas são um conceito fundamental na estatística. Elas representam incógnitas (como o famoso X) que assumem diferentes valores dependendo dos elementos estudados. Essas variáveis fornecem respostas importantes para diversas questões de análise.
Exemplos práticos de variáveis estatísticas:
- Quantas pessoas entre 25 e 30 anos foram infectadas por um vírus?
- Qual faixa etária registra o maior número de mortes por uma doença?
- Qual cidade apresenta o maior número de casos confirmados?
As variáveis se dividem em quantitativas e qualitativas, cada uma com características específicas que influenciam sua análise.
Variáveis quantitativas
As variáveis quantitativas são representadas por valores numéricos e podem ser divididas em dois tipos principais: discretas e contínuas.
- Variáveis Discretas:
São valores inteiros e contáveis, como o número de nascimentos em um hospital ao longo de um ano. Por exemplo, não se pode registrar 130,8 nascimentos, mas sim 130 ou 131. - Variáveis Contínuas:
Podem assumir qualquer valor dentro de um intervalo, seja um número inteiro, decimal ou até mesmo negativo. Um exemplo seria a altura média de uma população, que pode variar em medidas como 1,72 metros.
Variáveis qualitativas
As variáveis qualitativas descrevem características que não podem ser representadas numericamente, mas sim por categorias. Elas se dividem em dois subgrupos: nominais e ordinais.
- Variáveis Qualitativas Ordinais:
Representam uma ordem ou hierarquia entre categorias. Exemplos incluem grau de escolaridade (fundamental, médio, superior), tamanhos de roupa (P, M, G) ou classes sociais (baixa, média, alta). - Variáveis Qualitativas Nominais:
Não apresentam qualquer tipo de ordenação ou hierarquia entre as categorias. São geralmente classificações aleatórias, como o bairro onde um paciente reside ou o tipo de atendimento médico recebido.
Por que entender variáveis estatísticas é importante?
Compreender as variáveis estatísticas permite realizar análises mais precisas, identificar padrões e responder questões específicas de forma confiável. Além disso, esse entendimento ajuda a selecionar as melhores ferramentas para a análise de dados e para a tomada de decisões.
População e amostra
Na estatística, população e amostra são conceitos fundamentais que definem o alcance e a representatividade de um estudo. Entender a diferença entre esses dois termos é crucial para garantir análises confiáveis.
O que é uma população estatística?
A população estatística representa o conjunto total de elementos (pessoas, objetos ou eventos) que possuem características em comum e são alvo do estudo. Por exemplo:
- Estudar a altura média das pessoas na cidade de São Paulo implica considerar todas as pessoas que residem na cidade como a população.
O que é uma amostra?
A amostra é uma parte representativa da população usada em estudos estatísticos. É impossível analisar toda a população em muitos casos, então uma amostra bem definida permite obter resultados confiáveis com menos esforço.
- Exemplo: Em vez de medir a altura de todos os moradores de São Paulo, mede-se a altura de um grupo representativo selecionado.
Tamanho da amostra: Por que é tão importante?
O tamanho da amostra influencia diretamente a confiabilidade dos resultados. Uma amostra maior tende a ter maior representatividade e menor margem de erro. Por outro lado, uma amostra muito pequena pode levar a erros críticos, como:
- Selecionar acidentalmente pessoas com características extremas, como somente pessoas muito altas ou muito baixas.
- Reduzir a confiabilidade do estudo, dificultando a obtenção de conclusões precisas.
Quando uma amostra não reflete adequadamente as características da população, ela é chamada de amostra enviesada. Esse problema pode gerar interpretações equivocadas e, em casos críticos, levar a decisões prejudiciais, como:
- Erros em estudos sobre a propagação de uma doença.
- Falhas na avaliação de um produto, prejudicando os negócios.
Métodos para determinar o tamanho da amostra
Existem diferentes métodos para calcular o tamanho ideal da amostra. Eles variam de cálculos simples a abordagens mais complexas, dependendo do nível de confiança desejado. Alguns pontos a considerar:
- Margem de erro: Quanto menor a margem de erro desejada, maior deve ser a amostra.
- Nível de confiança: Reflete a probabilidade de os resultados estarem corretos. Um nível de confiança de 95% é comum em estudos.
- Variabilidade da população: Populações mais diversas requerem amostras maiores.
Com o auxílio de ferramentas como calculadoras estatísticas, é possível realizar esses cálculos de forma prática.
Dimensionamento de amostra
Dimensionar o tamanho ideal de uma amostra é fundamental para conseguirmos ter um retrato fiel de uma população uma vez que amostras muito pequenas podem induzir a erros e amostras excessivamente grandes podem ser um grande desperdício de tempo e de dinheiro.
Sabendo o que é uma amostra e os problemas que podemos enfrentar caso esta não seja um retrato fiel da população objeto do nosso estudo, vamos conferir alguns métodos para dimensionar seu tamanho.
Tamanho de amostra com base na Média Aritmética
Vamos supor que estejamos interessados em estimar a renda média das pessoas que concluíram um curso de Especialista Lean na FM2S, um ano após a conclusão do mesmo. Desta forma eu lhe pergunto: Quantas rendas devem ser incluídas em nossa amostra? Uma das forma de se dimensionar uma amostra é com base na renda média populacional através da fórmula:
n = [(Z α/2.σ)/d]²
Onde:
n = Número de indivíduos na amostra;
Z α/2 = Valor crítico que corresponde ao grau de confiança desejado;
σ = Desvio padrão da variável populacional estudada (neste caso a renda);
d = Margem de erro ou erro máximo da estimativa (consiste no valor da diferença entre a média amostral () e a média populacional).
Os valores de confiança mais utilizados e os valores de Z são tabelados conforme mostrado abaixo.

Tamanho da amostra com base na estimativa da proporção populacional
Eis um outro parâmetro que afeta o tamanho da amostra: a proporção populacional. Para isso vamos pensar na proporção de pessoas atendidas por uma unidade de saúde. Assim a fórmula para o tamanho da amostra fica:
n = (z².p.q)/d²
Onde:
n = Número de indivíduos na amostra;
Z α/2 = Valor crítico que corresponde ao grau de confiança desejado;
σ = Desvio padrão da variável populacional estudada (neste caso a renda);
p = Proporção de indivíduos que pertencem a categoria de interesse do nosso estudo;
q = Proporção de indivíduos que não pertencem a categoria de interesse (q = 1 - p);
d = Margem de erro ou erro máximo da estimativa (consiste no valor da diferença entre a média amostral e a média populacional).
Obs: caso os valores de p e q não sejam conhecidos, o recomendado é utilizar 0,5 para cada um deles.
Tamanho da amostra para populações finitas
Todas as formas de estimar as amostras que vimos até aqui, partem do pressuposto de que a população é tão grande que pode ser considerada infinita. No entanto, caso a amostra “n” tenha um tamanho maior ou igual a 5% da população “N” considera-se uma população finita e assim, adiciona-se um fator de correção nas fórmulas que vimos anteriormente, assim ficamos com: Fórmula para determinação do tamanho da amostra (n) com base na estimativa da média populacional:
n = {(Z²α/2.σ².N)/[d².(N-1)+ Z²α/2.σ²]}
Determinação do tamanho da amostra (n) com base na estimativa da proporção populacional:
n = {( Z²α/2. σ².N)/[d².(N-1)+ Z²α/2².p.q]}
Amostragem em Lean Seis Sigma
No contexto do Lean Seis Sigma, a amostragem desempenha um papel crucial na fase Measure do roteiro DMAIC. Essa etapa é responsável por coletar e validar dados que serão usados para entender o processo atual e identificar oportunidades de melhoria. Quer aprender mais sobre Lean Seis Sigma? Comece agora com o nosso curso gratuito de Yellow Belt da FM2S.
Fontes de dados na fase measure
Na fase Measure, as fontes de dados podem ser divididas em duas categorias principais:
- Dados Qualitativos: Geralmente obtidos através de reuniões com colaboradores. Esses dados ajudam a identificar percepções, problemas e hipóteses iniciais.
- Dados Quantitativos: Obtidos por meio do processo de amostragem. Esses dados são mais objetivos e servem como base para análises estatísticas.
Processo de amostragem quantitativa
A amostragem quantitativa no Lean Seis Sigma pode ser iniciada com a coleta de informações relacionadas à quantidade de produtos produzidos. Em casos onde a quantidade não é um fator significativo para o processo de melhoria, a população pode ser tratada como infinita, simplificando os cálculos.
Determinação do tamanho da amostra
Quando o objetivo é avaliar a qualidade de uma linha de produção, utiliza-se a estimativa da proporção populacional. Para isso, é necessário:
- Basear a proporção em experiências passadas ou em uma amostra piloto.
- Aplicar fórmulas estatísticas para calcular o tamanho ideal da amostra, garantindo representatividade.
Amostragem piloto e probabilística
A amostragem piloto é frequentemente utilizada para obter uma primeira estimativa do processo. Para garantir confiabilidade:
- Utilize uma amostragem probabilística, onde cada item tem a mesma probabilidade de ser selecionado.
- Realize a coleta de dados de forma aleatória, sem interferência do pesquisador.
Estratégia para garantir aleatoriedade
Uma técnica eficaz envolve dividir a amostra em seis subgrupos com intervalos de tempo pré-estabelecidos. Essa abordagem inclui:
- Coleta em dias e horários não avisados previamente.
- Garantia de que a seleção seja verdadeiramente aleatória.
Por que a amostragem é importante no lean seis sigma?
- Identificação de Variações: Permite entender variações no processo e identificar problemas.
- Base para Melhorias: Os dados coletados servem como base para tomar decisões informadas e implementar soluções eficazes.
- Redução de Custos: Evita análises desnecessárias de toda a população, otimizando recursos.
Com uma amostragem bem estruturada, a fase Measure no DMAIC se torna mais robusta, garantindo análises confiáveis e direcionadas para a melhoria contínua.
Com o término da amostragem piloto obtemos a proporção dos itens defeituosos, ou seja, produtos fora dos limites de especificação e, a partir disso, identifica-se o tamanho real da amostra que iria representar a população. Este é um exemplo de como a estatística básica se aplica ao Seis Sigma.
Leia mais: