O que é Análise de Dados? Como estruturar a sua?

análise de dados
21 de outubro de 2016
Última modificação: 30 de julho de 2021

Autor: Virgilio F. M. dos Santos
Categorias: Blog, Seis Sigma

O que é análise de dados?

A análise de dados é a transformação de números em informação, em significado, em solução de problemas. Infelizmente, isso não é algo tão simples como parece, especialmente se você é novo nas metodologias de análise.

Porém, há três princípios básicos que pode ajudá-lo a decidir como analisar os dados, além de inúmeras ferramentas. Nesse post, vamos comentar sobre os princípios da boa análise de dados e apresentar algumas ferramentas que são muito úteis quando você está querendo analisar dados para resolver problemas científicos ou corporativos. 

Esses princípios e ferramentas são mais a fundo trabalhados em nossos cursos de Green Belt e de Black Belt, para quem quiser se aprofundar mais nessa maravilhosa carreira.

Como seria se Sherlock Holmes fosse Green Belt?

Se o Sherlock Holmes vivesse no mundo dos negócios hoje em dia seria mais fácil para ele. Se ele fosse um Green Belt ou Black Belt teria a sua disposição várias poderosas ferramentas para investigar as causas dos defeitos. Estas ferramentas se dividem em duas principais categorias:

  • Análise de dados: utilização dos dados coletados para encontrar padrões, tendências e outras diferenças que podem sugerir, suportar ou rejeitar teorias sobre as causas ou os defeitos.
  • Análise dos processos: uma visualização detalhada dos processos chave existentes que atendem aos requisitos do cliente para identificar o tempo de ciclo, retrabalho, quebra e outros passos que não agregam valor para o cliente.

Como funciona a análise na prática?

A maioria das equipes Lean Seis Sigma utilizam os dois tipos de ferramentas em seus projetos. A análise de dados geralmente é utilizada no início, mas a equipe pode decidir utilizar a análise de processo antes ou dividir a equipe para que possa se utilizar as duas análises simultaneamente. Não importa qual conjunto sua equipe Seis Sigma utilize, todos eles passarão pelas três fases da análise de causa raiz:

  • Exploração: investigar os dados e/ou o processo com a mente aberta, apenas para ver o que você pode aprender;
  • Gerar hipóteses sobre as causas: utilizar o novo conhecimento encontrado para identificar as causas mais prováveis para os defeitos;
  • Testar as hipóteses ou eliminar as causas: utilizar os dados, experimentos ou mais análise do processo para verificar quais das potenciais causas contribuem significativamente para o problema.

Pela tabela 1, é fácil organizar os estágios em uma sequência lógica, mas na realidade não é tão claro assim. Sua equipe pode ter teorias antes de começar a exploração ou ter de voltar a fase inicial, pois a verificação das causas mostrou que elas não foram eliminadas. Na realidade, a maioria das equipes Lean Seis Sigma irão participar de vários PDSAs, ou ciclos de exploração, antes de eliminarem as causas para os problemas.

Mesmo se você passar por esses estágios fora de sequência ou precisar revisitá-los, ter o propósito do projeto claro em sua cabeça irá ajudar a equipe a manter as reuniões focadas.

“Estamos aqui para gerar teorias sobre causas para o efeito…”;

“Estamos aqui para entender como poderemos verificar estas três causas….”;

“A reunião de hoje irá focar em como nós analisaremos os dados”.

Quais os princípios da Análise de Dados?

Como definir o foco da análise de dados?

Saiba claramente o que você precisa descobrir ou qual é o problema a se resolver. Como todos sabem, estamos cercados por uma imensa quantidade de informação em nosso ambiente de trabalho e é fácil nos afogarmos nela. Revisite o objetivo da análise de dados e a declaração do problema regularmente para manter na cabeça o que a equipe está tentando fazer.

Várias ferramentas nos ajudam a ter foco. Acredito que as mais importantes são as Três Questões Fundamentais e o Ciclo PDSA.

A primeira ferramenta consiste nas três questões:

  • 1. O que queremos realizar? O que nos ajuda a verbalizar o nosso objetivo?
  • 2. Como saberemos que atingimos esse objetivo? O que nos força a atrelar a resposta a um indicador ou a um dado?
  • 3. O que vamos fazer para atingir esse objetivo?  O que nos ajuda a desenvolver ações ao final da análise de dados?

Por exemplo, se estamos trabalhando em um projeto para melhorar a qualidade de uma linha de produção, temos que entender o que é qualidade para ela. Com isso, podemos ter um indicador pra responder a segunda pergunta. Podemos talvez dizer que a qualidade melhorou quando o número de defeitos na linha for reduzido. No caso:

  1. O que queremos realizar: melhorar a qualidade da linha;
  2. Como saberemos que tivemos sucesso: quando o indicador de defeitos na linha for reduzido de X para Y;
  3. O que podemos fazer para atingir esse objetivo: podemos começar usando uma ferramenta, como o Diagrama de Ishikawa, para entender por que esse defeito ocorre.

Viu como é simples? Entretanto, não é fácil! É preciso muita disciplina para manter o foco e uma boa dosagem de experiência para defini-lo de maneira adequada.

Temos um curso gratuito que é justamente para ajudar as pessoas a aprender transformar problemas abstratos em trabalháveis, gerando melhorias em processos: Curso de White Belt. Vale a pena conferir, lá também falamos do PDSA. Mas antes, vamos ver os outros princípios da análise de dados.

Como definir suas hipóteses para a análise de dados?

Ter uma hipótese para explicar o que está acontecendo é fundamental em qualquer análise de dados. Há dezenas, se não centenas, de ferramentas de análise, mas equipes de analistas podem perder muito tempo em becos sem saída se não tomarem cuidado. Quando você coletar todas as evidências (à lá Sherlock Holmes), ter uma hipótese irá ajudá-lo a juntar todas as informações.

Hipóteses são importantes, pois é com base nela que você vai entender o fenômeno. Além disso, você pode refiná-la a ponto de elaborar uma teoria mais complexa, que te ajudará a prever o comportamento do processo ou fenômeno que você está estudando. Em ambientes corporativos, geralmente hipóteses se constroem em volta de problemas ou oportunidades. Por exemplo:

  • Problema percebido: uma pizzaria, QPizza!, vem perdendo clientes. O faturamento está caindo já faz 3 meses e os donos do negócio sentem que o movimento anda meio fraco. Além disso, boa parte dos clientes reclamam que o serviço “não está bom” e não voltam mais.
  • Hipótese: o aumento nas reclamações do restaurante QPizza! e da perda dos clientes é resultado de uma equipe de garçons novos e inexperientes.

Como comprovamos se essa hipótese é verdadeira ou não? É isso que devemos fazer com a análise. Note que, se descobrirmos que essa hipótese é verdadeira, que os novos garçons são o problema, podemos facilmente agir em cima da causa e resolver o problema, aumentando novamente o faturamento.

  • Abordagem de análise: para comprovar ou refutar a hipótese, podemos dividir os dados de reclamações dos clientes em dois grupos – dados dos clientes servidos pelos novos garçons e dados das pessoas servidas pelos garçons experientes. Depois, procurar de maneira sistêmica as diferenças nestes dois grupos.
  • A ressalva aqui é que você deve estar aberto a possibilidade de que sua hipótese esteja errada. Você não pode ignorar os dados que contradizem suas suspeitas. Pessoas com experiência em coletar dados sabem disso e sabem também que a maioria das teorias estão erradas. Mas aprender o que não é, ajuda muito a chegarmos ao que é. Lembre-se do que Thomas Edison dizia: nunca falhei, apenas aprendi 1000 maneiras de não fazer a lâmpada.

Como estruturar as perguntas da Análise de Dados?

Faça diversas perguntas sobre frequência, impacto e tipo dos sintomas associados ao que quer desvendar. Se você limita sua investigação a apenas uma hipótese ou uma pergunta somente, você nunca saberá se fez as questões corretas. Uma melhor abordagem é fazer várias questões sobre os dados e encontrar por meio das análises quais das questões são importantes e quais não são. Veja algumas questões alternativas que a equipe do QPizza! poderia fazer:

  • Os clientes servidos pela equipe de garçons mais jovens reclamam com maior frequência que outros clientes? (Frequência do problema);
  • Sobre o que os clientes servidos pelos garçons mais jovens reclamam? Como isso se compara às reclamações recebidas dos clientes atendidos pela equipe mais experiente? (Tipo do problema observado);
  • Se os clientes atendidos pelos garçons mais novos reclamam mais, isso significa que a chance de eles voltarem ao restaurante é menor? (Impacto do problema).

Sua equipe precisa ter um entendimento profundo dos problemas para fazer as escolhas corretas sobre onde investir o tempo e onde implementar mudanças. Se não fizer isso, poderá perder três meses consertando um problema que não é frequente e nem impacta os clientes.

Quais são as ferramentas para análise de dados?

Existem várias ferramentas para análise de dados. A seguir, vamos compilar algumas para você. Cada uma está redirecionada para um artigo no qual você pode encontrar mais informações sobre elas e até alguns e-books, apostilas ou então vídeos. Separamos das mais simples para as mais complicadas e colocamos uma breve explicação sobre elas. Confira!

Ferramentas simples

Sugerimos que clique nos links e estude cada uma delas antes de usar. Lá explicamos tudo em mais detalhes e fornecemos vários tutoriais.

Ferramenta O que é e quando usar
Diagrama de Ishikawa ou Diagrama de causa e efeito É uma das sete ferramentas da qualidade que nos permite discutir possíveis causas para um efeito. Geralmente usado para se estudar problemas em ambiente corporativo.
Gráfico de tendência É um gráfico que nos dá uma visão dinâmica sobre o processo. Ele nos permite fazer a análise de causas especiais, a fim de entender quando um processo está dentro ou fora de seu comportamento padrão.
Gráfico de Pareto Outra das sete ferramentas da qualidade. O gráfico de Pareto tem como objetivo mostrar a frequência de um indicador categórico. Usamos esta ferramenta quando queremos priorizar análises de dados ou ações de melhoria. A lógica dele é identificar o que dá mais problemas e atacar ali primeiro.
Formulário de coleta de dados Toda boa análise começa com bons dados. Elaborar um bom formulário de coleta de dados nos ajuda a entender melhor o que está acontecendo. Devemos usar sempre que precisamos coletar novos dados para se testar uma hipótese.
Folha de Verificação Também é uma das  sete ferramentas da qualidade, sendo um caso especial de formulário de coleta de dados. A sua particularidade é que ele torna fácil essa coleta e sempre a atrela a uma característica de interesse de um produto. Usamos esse formulário geralmente para coletar dados sobre defeitos em produtos.
Os 5 porquês Essa ferramenta é bem simples e ficou famosa com o Lean Manufacturing. Usamos ela quando queremos entender as causas mais profundas de um problema. Começamos com ele e perguntamos o seu “porquê” em geral 5 vezes. Ela nos ajuda a montar hipóteses e a instigar a vontade de coletar dados para responder às perguntas.
Gráfico de dispersão Mais uma das sete ferramentas da qualidade. Com este gráfico podemos procurar correlações entre variáveis. além de poder estudar nossas hipóteses do que influenciam no que.
Histograma Outra das sete ferramentas da qualidade. Com ela, podemos entender qual é a frequência de valores em uma distribuição de dados. Usamos quando queremos estudar o comportamento natural de nosso processo.
Box-Plot Outro gráfico para avaliar a frequência de nossos dados, assim como o histograma. A diferença é que com ele fica mais fácil comparar vários cenários, distribuições ou tratamentos.

Ferramentas de média complexidade

Ferramenta O que é e quando usar
Regressão Linear Esta ferramenta é uma sofisticação do bom e velho gráfico de dispersão. Ao invés de apenas dizer o que pode influenciar no que, a regressão linear nos permite dizer o quanto uma variável influencia em outra. Além disso, é possível sofisticar bem o modelo, fazendo uma análise de regressão multivariada (com mais de 1 variável de entrada ao mesmo tempo).
Cartas de Controle Mais uma das ferramentas da qualidade. Esses gráficos são como os gráficos de tendência, porém mais sofisticados. Com eles, temos limites de controle para acompanhar a variação de um indicador ao longo do tempo. Quando um ponto sai desses limites, algo anormal está acontecendo em seu processo.
Análises de Capabilidade Fazer uma análise de capabilidade nos permite dizer se a variação do nosso processo está de acordo com o que nossos clientes esperam. Ela é ideal para análises de dados onde queremos prever o número de defeitos que nosso processo pode produzir.
Análise do Sistema de Medição Já falamos que a qualidade dos dados é muito importante para qualquer análise de dados. Com a ferramenta do MSA – Measure System Analysis – podemos entender o quanto a nossa ineficiência em coletar dados está atrapalhando nossa análise.
FMEA FMEA – Failure Mode and Effect Analysis ou Análise do modo de falha. Usamos esta ferramenta quando queremos entender melhor o que pode causar a falha em um produto ou processo. Ela nos ajuda a pesar a ocorrência, a consequência e a probabilidade de detectar as possíveis falhas.

Ferramentas mais complexas

Ferramenta O que é e quando usar
Análises de probabilidade Fazer uma análise de probabilidade é dizer o quão provável algo acontecerá. Podemos calcular probabilidades a partir de análise combinatória, conjuntos de dados ou então de novos fatos, através do Teorema de Bayes. Em análise de dados isso nos ajuda muito a entender hipóteses mais complexas. Em nosso curso de Black Belt, discutimos essas técnicas a fundo.
ANOVA ANOVA significa “Analysis of Variance”. Essa análise nada mais é do que procurar diferenças entre grupos de dados através da variação que os dados apresentam. Usamos essa técnica na prática para identificar diferenças entre conjuntos de dados, por exemplo, o tempo de atendimento dos garçons mais novos é significativamente diferente do dos mais velhos? Essa técnica também é bastante discutida no curso de Black Belt.
Testes estatísticos de hipóteses Assim como na ANOVA, podemos usar outros tipos de análise estatística para estudar as diferenças entre conjuntos de dados. Entre os testes de hipótese mais famosos, temos o “teste t“, o “teste p” e o “teste z“.
Planejamento de Experimentos (DOE)  DOE – Design of Experiments. Planejar um experimento é formulá-lo de maneira a obter o máximo de informação com o mínimo de custos. Existem várias formas estatísticas de planejarmos nossos experimentos dessa forma e testarmos nossas hipóteses.

Quer aprofundar mais sobre análise de dados?

O Restaurante QPizza!, apresentado acima, por exemplo, deveria ter estratificado os dados de reclamação por “novos” vs “experientes” para realizar a análise. Aproveitando o gancho, em nossas certificações White Belt, Green Belt e Black Belt, exploramos muito a análise de dados. Há diversos vídeos em que explicamos como fazer análises como esta, no Minitab e no Excel. Contamos também com o curso Análise em Excel.

Por que não começa agora a construir o futuro que deseja. Comece pelos cursos gratuitos, você vai gostar!

Onde aplicar a análise de dados?

Para exemplificar ainda mais a análise de dados, vamos começar comparando o dólar com a bolsa de valores. Qual será que foi o comportamento do Ibovespa divido pelo dólar? Quem cresceu mais ao longo dos anos?

análise de dados

Figura 1: gráfico de tendência do Ibovespa/dólar (PTAX).

Pela figura 1, percebemos que o intervalo escolhido é de 13 anos. Ao comparar o ano de 1997 e de 2015, vimos que, em dólar, as empresas que compõem o índice estão com o mesmo valor. E como será que está o comportamento dólar e do Ibovespa separadamente?

análise de dados

Figura 2: gráfico de tendência do dólar e do Ibovespa.

Por meio desta pesquisa quantitativa, é possível verificar que a bolsa ainda se arrasta, mas o dólar foi o carro chefe. Pela análise, bateu o valor de 3,80 que havia alcançado em outro de 2002, quando Lula foi eleito. E a dívida?

análise de dados

Figura 3: dívida mobiliária interna federal.

A dívida continua forte, cada vez subindo mais. Como o gráfico da figura 3 não nos diz muito, um bom exercício é calcularmos a variação mensal dessa dívida. Será que essa dívida está crescendo mais rápido ou mais devagar nos últimos anos?

análise de dados

Figura 4: análise do crescimento da dívida mês.

O crescimento da dívida está sob controle. Cresce sempre dentro do intervalo conhecido, com uma média de 1,53% variando de -5 a +8%. Imagine se na sua casa você aumentasse o quanto a família deve em 1,5% ao mês. Sua dívida aumentaria 20% ao ano. Olha que coisa boa, você começa o ano devendo 100 mil e termina devendo 120 mil. Em 20 anos, tempo médio para pagar um imóvel, você estaria devendo 35 vezes o valor inicial. Independentemente de ser azul ou vermelho, o Brasil precisa muito de um choque de gestão. E a dívida externa? Será que melhorou em dólar?

análise de dados

Figura 5: gráfico de tendência da dívida externa bruta em dólares.

Dívida externa bombando também. Depois de 2009 a dívida dobrou, parece que a saída da crise adotada pelo governo levou a esta crise que vivemos hoje.

análise de dados

Figura 6: taxa de desocupação nas regiões metropolitanas.

Por último, vamos à tradicional taxa de desocupação nas regiões metropolitanas. Em agosto, o índice alcançou 7,9%. Continuamos crescendo, mas não vamos viver a crise. Vamos aproveitá-la para tirar os projetos do papel e sairmos dela muito melhor do que entramos. Conte com a FM2S para te ajudar nesta atividade.

Deixe seu comentário

3 Comentários

  • Regina Martins disse:

    Achei esse artigo maravilhoso e os hiperlinks para as ferramentas vai me gerar muito tempo de estudo.
    Quero parabenizar a vocês pelo site maravilhoso e o fato de eu adquirir conhecimentos novos e reforçar os que já possuo.
    Muito obrigada.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *