Analise-dados
Análise de dados

21 de outubro de 2016

Última atualização: 05 de dezembro de 2023

Análise de Dados: Definição e tipos

A análise de dados é a transformação de números em informação para melhorar a tomada de decisão em solução de problemas. A fórmula se tornou tão presente e importante que, segundo uma pesquisa da Forrester de 2018, empresas orientadas por dados podem crescer mais de 30% ao ano.

Infelizmente, isso não é algo tão simples como parece, especialmente se você é novo nas metodologias de análise e em termos como, big data.

Porém, há três princípios básicos que pode ajudá-lo a analisar os dados, além de inúmeras ferramentas. Nesse post, vamos comentar sobre os diferentes tipos de análise de dados e apresentar algumas ferramentas muito úteis.

O que é Análise de Dados e para que é usada?

A análise de dados é um processo de inspeção, limpeza, transformação e modelagem de dados com o objetivo de descobrir informações úteis, chegar a conclusões e apoiar a tomada de decisão. Ela é essencial em diversos campos, desde negócios e finanças até ciência e tecnologia, desempenhando um papel crucial em ajudar organizações e indivíduos a entenderem e a utilizarem eficientemente as informações contidas nos dados.

Ao extrair informações significativas de grandes conjuntos de dados, ela permite aos profissionais entender melhor o desempenho, identificar tendências e padrões, e prever cenários futuros. Isso é especialmente importante em ambientes de negócios, onde a análise de dados ajuda a otimizar processos, aumentar a eficiência, reduzir custos e identificar novas oportunidades de mercado.

Além de seu uso em negócios, a análise de dados é crucial na pesquisa científica, onde facilita descobertas significativas ao permitir que os cientistas testem hipóteses e analisem experimentos de maneira mais eficiente. Na saúde, ajuda na melhoria do atendimento ao paciente e no desenvolvimento de tratamentos mais eficazes. Na educação, contribui para a criação de estratégias de ensino mais eficientes e na compreensão do desempenho dos alunos.

Na sua essência, a análise de dados envolve um conjunto de técnicas e processos que permitem extrair significado de conjuntos de dados, muitas vezes complexos e volumosos. 

ebook power bi

Introdução sobre os 4 tipos de análise de dados

Análise de Dados Descritiva

O primeiro tipo de análise de dados é a análise descritiva. É a base de todos os insights de dados. Ou seja, é o uso mais simples e comum de dados nos negócios atualmente.

Em síntese, a análise de dados pode ser feita para responder a “o que aconteceu”, com base aos dados anteriores coletados, geralmente na forma de painéis. O maior uso da análise descritiva em negócios é rastrear indicadores-chave de desempenho (KPIs).

Os KPIs descrevem o desempenho de um negócio com base em benchmarks escolhidos.

Análise de Dados Prescritiva

A análise prescritiva utiliza tecnologia de ponta e práticas de dados. É um grande compromisso organizacional e as empresas devem ter certeza de que estão prontas e dispostas a colocar esforços e recursos.

Análise de Dados Preditiva

Este tipo de análise é mais um passo à frente das análises descritiva e diagnóstica. Basicamente, a análise preditiva usa os dados que já temos para fazer previsões lógicas dos resultados dos eventos de ocorrência.

Decerto, essa análise depende de modelagem estatística, que requer tecnologia e mão de obra adicionais para fazer previsões.

Também é importante entender que a previsão é apenas uma estimativa; a precisão das previsões depende da qualidade e de dados detalhados.

Análise de Dados Diagnóstica

A análise diagnóstica leva os insights encontrados a partir de análises descritivas e detalha para encontrar as causas desses resultados.

As organizações fazem uso desse tipo de análise, pois ele cria mais conexões entre os dados e identifica padrões de comportamento.

Como funciona a análise de dados na prática?

Na prática, a análise de dados é um processo multifacetado que envolve várias etapas, desde a coleta inicial de dados até a geração de insights acionáveis. Vamos detalhar como isso funciona:

  • Coleta de Dados: Tudo começa com a coleta de dados, que podem vir de diversas fontes como bancos de dados internos, pesquisas, sensores, transações online, redes sociais, entre outros. Estes dados podem ser estruturados (como tabelas em um banco de dados) ou não estruturados (como textos ou imagens).
  • Limpeza e Preparação de Dados: Esta é uma etapa crucial. Os dados coletados frequentemente contêm erros, valores ausentes ou irrelevantes. A limpeza envolve corrigir ou remover esses erros, enquanto a preparação inclui transformar e organizar os dados de forma que possam ser efetivamente analisados.
  • Exploração de Dados: Antes de aplicar modelos mais complexos, os analistas exploram os dados para entender suas características básicas. Isso pode envolver a utilização de estatísticas descritivas para resumir os dados e visualizações para identificar padrões ou anomalias.
  • Análise Estatística e Modelagem: Dependendo do objetivo, a análise pode envolver métodos estatísticos para testar hipóteses ou técnicas de modelagem, como regressão ou classificação, para fazer previsões ou detectar tendências.
  • Interpretação dos Resultados: Os resultados dos métodos estatísticos ou modelos são então interpretados. Isso significa entender o que os resultados indicam no contexto do problema específico e quais insights podem ser derivados.
  • Comunicação dos Insights: Por fim, os insights devem ser comunicados de forma eficaz, geralmente através de relatórios, visualizações ou apresentações. Esta etapa é crucial para garantir que os resultados da análise sejam compreendidos e utilizados na tomada de decisões.

Na prática, a análise de dados é um processo iterativo e adaptativo. Os analistas podem precisar revisitar algumas etapas, ajustar suas abordagens ou explorar novas técnicas com base nos insights obtidos. Além disso, com o avanço da tecnologia, ferramentas como inteligência artificial e aprendizado de máquina estão se tornando cada vez mais integradas à análise de dados, permitindo análises mais profundas e insights mais sofisticados.

Existe diferença entre Data Science, Big Data e Data Analytics?

Big Data, Data Science e Data Analytics são termos cruciais no universo tecnológico atual, cada um desempenhando um papel distinto no manejo e interpretação de dados. 

Começando pelo Big Data que se refere ao imenso volume de dados gerados continuamente no mundo digital. Esses dados são caracterizados não apenas pelo seu tamanho maciço, mas também pela variedade de tipos e pela velocidade com que são produzidos e processados. Eles oferecem um potencial significativo para insights, mas também apresentam desafios consideráveis em termos de armazenamento, análise e interpretação.

Data Science, por outro lado, é uma disciplina que abrange a extração de conhecimento e insights de dados complexos e, muitas vezes, de Big Data. Utilizando uma combinação de métodos de várias disciplinas, como estatística, aprendizado de máquina e mineração de dados, a Data Science procura entender padrões, fazer previsões e informar decisões. É um campo interdisciplinar que utiliza teorias e técnicas de várias áreas para interpretar e resolver problemas complexos relacionados a dados.

Data Analytics, enquanto isso, é mais focado na análise de conjuntos de dados para concluir informações. Difere da Data Science em seu escopo mais imediato e prático. Enquanto a Data Science pode incluir a exploração de dados e o desenvolvimento de modelos preditivos complexos, a Data Analytics geralmente envolve a aplicação de técnicas estatísticas e de análise para entender tendências históricas e atuais, muitas vezes com o objetivo de informar decisões de negócios ou operacionais.

Embora esses três campos se sobreponham e se interconectem, cada um possui um conjunto único de objetivos, técnicas e aplicações. Big Data fornece a matéria-prima, a Data Science fornece os métodos para entender essa matéria-prima e a Data Analytics foca em extrair conclusões práticas e acionáveis. Juntos, eles formam um ecossistema de dados que é fundamental para o mundo tecnológico moderno, impulsionando inovações e ajudando organizações a tomar decisões informadas.

Quais os princípios da Análise de Dados?

Definindo o foco

Antes de tudo, de fazer uma análise de dados, saiba claramente o que você precisa descobrir ou qual é o problema a se resolver  Como todos sabem, estamos cercados por uma imensa quantidade de informação em nosso ambiente de trabalho e é fácil nos afogarmos nela.

Então, revisite o objetivo da análise de dados e a declaração do problema regularmente para manter na cabeça o que a equipe está tentando fazer.

Várias ferramentas nos ajudam a ter foco. Acredito que as mais importantes são as Três Questões Fundamentais e o Ciclo PDSA.

A primeira ferramenta consiste nas três questões:

1. O que queremos realizar? O que nos ajuda a verbalizar o nosso objetivo?

2. Como saberemos que atingimos esse objetivo? O que nos força a atrelar a resposta a um indicador ou a um dado?

3. O que vamos fazer para atingir esse objetivo?  O que nos ajuda a desenvolver ações ao final da análise de dados?

Por exemplo, se estamos trabalhando em um projeto para melhorar a qualidade de uma linha de produção, temos que entender o que é qualidade para ela. Com isso, podemos ter um indicador para responder a segunda pergunta. Ou seja, podemos talvez dizer que a qualidade melhorou quando o número de defeitos na linha for reduzido.

No caso:

O que queremos realizar: melhorar a qualidade da linha;

Como saberemos que tivemos sucesso: quando o indicador de defeitos na linha for reduzido de X para Y; O que podemos fazer para atingir esse objetivo: podemos começar usando uma ferramenta, como o Diagrama de Ishikawa, para entender por que esse defeito ocorre.

Viu como é simples? Entretanto, não é fácil! É preciso muita disciplina para manter o foco e uma boa dosagem de experiência para defini-lo de maneira adequada.

Definindo as hipóteses

Ter uma hipótese para explicar o que está acontecendo é fundamental em qualquer análise de dados. Ademais, há dezenas, se não centenas, de ferramentas de análise, mas equipes de analistas podem perder muito tempo em becos sem saída se não tomarem cuidado.

Portanto, quando você coletar todas as evidências (à lá Sherlock Holmes), ter uma hipótese irá ajudá-lo a juntar todas as informações.

Hipóteses são importantes

É com base nela que você vai entender o fenômeno. Além disso, você pode refiná-la a ponto de elaborar uma teoria mais complexa, que te ajudará a prever o comportamento do processo ou fenômeno que você está estudando.

Em ambientes corporativos, geralmente hipóteses se constroem em volta de problemas ou oportunidades. Por exemplo:

Problema percebido:

Uma pizzaria, QPizza!, vem perdendo clientes. O faturamento está caindo já faz 3 meses e os donos do negócio sentem que o movimento anda meio fraco. Além disso, boa parte dos clientes reclamam que o serviço "não está bom" e não voltam mais.

Hipótese:

O aumento nas reclamações do restaurante QPizza! e da perda dos clientes é resultado de uma equipe de garçons novos e inexperientes. Como comprovamos se essa hipótese é verdadeira ou não? É isso que devemos fazer com a análise.

Note que, se descobrirmos que essa hipótese é verdadeira, que os novos garçons são o problema, podemos facilmente agir em cima da causa e resolver o problema, aumentando novamente o faturamento.

Abordagem de análise:

Para comprovar ou refutar a hipótese, podemos dividir os dados de reclamações dos clientes em dois grupos, dados dos clientes servidos pelos novos garçons e dados das pessoas servidas pelos garçons experientes. Depois, procurar de maneira sistêmica as diferenças nestes dois grupos.

A ressalva aqui é que você deve estar aberto a possibilidade de que sua hipótese esteja errada. Você não pode ignorar os dados que contradizem suas suspeitas. Pessoas com experiência em coletar dados sabem disso e sabem também que a maioria das teorias estão erradas. Mas aprender o que não é, ajuda muito a chegarmos ao que é.

Lembre-se do que Thomas Edison dizia: nunca falhei, apenas aprendi 1000 maneiras de não fazer a lâmpada.

Como estruturar as perguntas da Análise de Dados?

A princípio, faça diversas perguntas sobre frequência, impacto e tipo dos sintomas associados ao que quer desvendar. Isto é, se você limita sua investigação a apenas uma hipótese ou uma pergunta somente, você nunca saberá se fez as questões corretas.

Em outras palavras, uma melhor abordagem é fazer várias questões sobre os dados e encontrar por meio das análises quais das questões são importantes e quais não são. Veja algumas questões alternativas que a equipe do QPizza! poderia fazer:

  • Os clientes servidos pela equipe de garçons mais jovens reclamam com maior frequência que outros clientes? (Frequência do problema);
  • Sobre o que os clientes servidos pelos garçons mais jovens reclamam? Como isso se compara às reclamações recebidas dos clientes atendidos pela equipe mais experiente? (Tipo do problema observado);
  • Se os clientes atendidos pelos garçons mais novos reclamam mais, isso significa que a chance de eles voltarem ao restaurante é menor? (Impacto do problema).

Por certo, sua equipe precisa ter um entendimento profundo dos problemas para fazer as escolhas corretas sobre onde investir o tempo e onde implementar mudanças. Se não fizer isso, poderá perder três meses consertando um problema que não é frequente e nem impacta os clientes.

Como a análise pode ajudar na tomada de decisões informadas e estratégicas?

Compreender o desempenho passado

A análise de dados pode ajudar a compreender o desempenho passado de uma organização, incluindo métricas como vendas, lucro, satisfação do cliente e engajamento dos funcionários. Ao analisar os dados passados, as organizações podem entender o que funcionou e o que não funcionou, e tomar decisões informadas com base nessas informações.

Identificar tendências

A análise de dados pode ajudar a identificar tendências importantes que podem afetar a organização no futuro. Isso inclui tendências de mercado, mudanças nos interesses dos clientes e mudanças na legislação. Ao identificar essas tendências, as organizações podem tomar decisões informadas e estratégicas para se adaptar às mudanças no ambiente em que operam.

Prever resultados futuros

A análise de dados também pode ser usada para prever resultados futuros, como o desempenho financeiro, o crescimento do mercado e a satisfação do cliente. Ao prever esses resultados, as organizações podem tomar decisões informadas e estratégicas sobre como investir seus recursos e como se preparar para as mudanças no ambiente em que operam.

Identificar oportunidades

A análise de dados pode ajudar a identificar oportunidades de negócios que podem ser aproveitadas. Isso pode incluir novos mercados para entrar, novos produtos para desenvolver ou novas parcerias a serem estabelecidas. Ao identificar essas oportunidades, as organizações podem tomar decisões informadas e estratégicas sobre onde investir seus recursos.

Reduzir os riscos

A análise de dados também pode ser usada para reduzir os riscos associados às decisões importantes. Isso pode incluir o uso de modelos de previsão para avaliar o risco financeiro de um novo investimento ou o uso de análise de risco para identificar riscos de segurança cibernética. Ao reduzir os riscos associados, as organizações podem tomar decisões informadas e estratégicas com mais confiança.

Quais são as habilidades necessárias para realizar uma análise eficaz?

Conhecimento em matemática e estatística

A análise envolve trabalhar com dados, e para trabalhar com dados, é preciso ter uma sólida base em matemática e estatística. Isso inclui conhecimento em probabilidade, estatística descritiva, inferência estatística, regressão, álgebra linear e cálculo.

Conhecimento em programação

A maioria dos profissionais de análise usa linguagens de programação para manipular e analisar dados. Isso inclui linguagens como Python, R e SQL. É importante ter conhecimentos em programação, como manipulação de dados, visualização de dados e análise de dados.

Conhecimento em banco de dados

Para realizar uma análise eficaz, é necessário ter conhecimento em bancos de dados. Isso inclui saber como coletar, limpar e armazenar dados. É importante entender os diferentes tipos de bancos de dados, como bancos de dados relacionais e bancos de dados NoSQL.

Habilidade de comunicação

Realizar uma análise eficaz não é suficiente. É preciso também comunicar os resultados de forma clara e concisa. A habilidade de comunicar os resultados da análise para uma audiência não técnica é essencial para o sucesso do projeto.

Habilidade de resolução de problemas

A análise é um processo que envolve muitos problemas diferentes, como dados ausentes, dados duplicados, valores extremos e erros de entrada de dados. É importante ter habilidades de resolução de problemas para superar esses desafios.

Pensamento crítico

A análise envolve interpretar os dados e tirar conclusões a partir deles. É importante ter pensamento crítico para avaliar os resultados da análise e identificar as principais conclusões que precisam ser comunicadas.

Conhecimento em negócios

Em muitos casos, a análise é usada para tomar decisões de negócios importantes. É importante ter conhecimento em negócios para entender como a análise pode ser aplicada e como os resultados podem ser usados para tomar decisões informadas.

Quais são as ferramentas para análise de dados?

Existem várias ferramentas para análise de dados. A seguir, vamos compilar algumas para você. Cada uma está redirecionada para um artigo no qual você pode encontrar mais informações sobre elas e até alguns e-books, apostilas ou então vídeos.

Em suma, separamos das mais simples para as mais complicadas e colocamos uma breve explicação sobre elas. Confira!

Ferramentas simples

Sugerimos que clique nos links e estude cada uma delas antes de usar. Lá explicamos tudo em mais detalhes e fornecemos vários tutoriais.

Ferramenta

O que é e quando usar

Diagrama de Ishikawa ou Diagrama de causa e efeito

 

É uma das sete ferramentas da qualidade que nos permite discutir possíveis causas para um efeito. Geralmente usado para se estudar problemas em ambiente corporativo.

 

Gráfico de tendência

 

É um gráfico que nos dá uma visão dinâmica sobre o processo. Ele nos permite fazer a análise de causas especiais, a fim de entender quando um processo está dentro ou fora de seu comportamento padrão.

 

Gráfico de Pareto

 

Outra das sete ferramentas da qualidade. O gráfico de Pareto tem como objetivo mostrar a frequência de um indicador categórico. Ademais, Usamos esta ferramenta quando queremos priorizar análises de dados ou ações de melhoria. A lógica dele é identificar o que dá mais problemas e atacar ali primeiro.

 

Formulário de coleta de dados

 

Toda boa análise começa com bons dados. Por exemplo, elaborar um bom formulário de coleta de dados nos ajuda a entender melhor o que está acontecendo. Devemos usar sempre que precisamos coletar novos dados para se testar uma hipótese.

 

Folha de Verificação

 

Também é uma das  sete ferramentas da qualidade, sendo um caso especial de formulário de coleta de dados. A sua particularidade é que ele torna fácil essa coleta e sempre a atrela a uma característica de interesse de um produto. Usamos esse formulário geralmente para coletar dados sobre defeitos em produtos.

 

Os 5 porquês

 

Essa ferramenta é bem simples e ficou famosa com o Lean Manufacturing. Usamos ela quando queremos entender as causas mais profundas de um problema. Começamos com ele e perguntamos o seu "porquê" em geral 5 vezes. Ela nos ajuda a montar hipóteses e a instigar a vontade de coletar dados para responder às perguntas.

 

Gráfico de dispersão

 

Mais uma das sete ferramentas da qualidade. Com este gráfico podemos procurar correlações entre variáveis. além de poder estudar nossas hipóteses do que influenciam no que.

 

Histograma

 

Outra das sete ferramentas da qualidade. Com ela, podemos entender qual é a frequência de valores em uma distribuição de dados. Usamos quando queremos estudar o comportamento natural de nosso processo.

 

Box-Plot

 

Outro gráfico para avaliar a frequência de nossos dados, assim como o histograma. A diferença é que com ele fica mais fácil comparar vários cenários, distribuições ou tratamentos.

 

Ferramentas de média complexidade

Ferramenta

O que é e quando usar

Regressão Linear

 

Esta ferramenta é uma sofisticação do bom e velho gráfico de dispersão. Certamente, ao invés de apenas dizer o que pode influenciar no que, a regressão linear nos permite dizer o quanto uma variável influencia em outra. Além disso, é possível sofisticar bem o modelo, fazendo uma análise de regressão multivariada (com mais de 1 variável de entrada ao mesmo tempo).

 

Cartas de Controle

 

Mais uma das ferramentas da qualidade. Esses gráficos são como os gráficos de tendência, porém mais sofisticados. Com eles, temos limites de controle para acompanhar a variação de um indicador ao longo do tempo. Quando um ponto sai desses limites, algo anormal está acontecendo em seu processo.

 

Análises de Capabilidade

 

Fazer uma análise de capabilidade nos permite dizer se a variação do nosso processo está de acordo com o que nossos clientes esperam. Afinal, ela é ideal para análises de dados onde queremos prever o número de defeitos que nosso processo pode produzir.

 

Análise do Sistema de Medição

 

Já falamos que a qualidade dos dados é muito importante para qualquer análise de dados. Com a ferramenta do MSA - Measure System Analysis - podemos entender o quanto a nossa ineficiência em coletar dados está atrapalhando nossa análise.

 

FMEA

 

FMEA - Failure Mode and Effect Analysis ou Análise do modo de falha. Usamos esta ferramenta quando queremos entender melhor o que pode causar a falha em um produto ou processo. Ela nos ajuda a pesar a ocorrência, a consequência e a probabilidade de detectar as possíveis falhas.

 

Ferramentas mais complexas

Ferramenta

O que é e quando usar

Análises de probabilidade

 

Fazer uma análise de probabilidade é dizer o quão provável algo acontecerá. Podemos calcular probabilidades a partir de análise combinatória, conjuntos de dados ou então de novos fatos, através do Teorema de Bayes. Em análise de dados isso nos ajuda muito a entender hipóteses mais complexas. Em nosso curso de Black Belt, discutimos essas técnicas a fundo.

 

ANOVA

 

ANOVA significa "Analysis of Variance". Essa análise nada mais é do que procurar diferenças entre grupos de dados através da variação que os dados apresentam. Usamos essa técnica na prática para identificar diferenças entre conjuntos de dados, por exemplo, o tempo de atendimento dos garçons mais novos é significativamente diferente do dos mais velhos? Essa técnica também é bastante discutida no curso de Black Belt.

 

Testes estatísticos de hipóteses

 

Assim como na ANOVA, podemos usar outros tipos de análise estatística para estudar as diferenças entre conjuntos de dados. Entre os testes de hipótese mais famosos, temos o "teste t", o "teste p" e o "teste z".

 

Power BI

 

O Power BI é uma poderosa ferramenta de análise de dados desenvolvida pela Microsoft. Ele permite que os usuários importem dados de várias fontes, os transformem e os visualizem de maneira interativa. O Power BI é amplamente utilizado para criar relatórios e painéis dinâmicos, fornecendo insights valiosos a partir dos dados.

 

Quer aprofundar mais sobre análise de dados?

O Restaurante QPizza!, apresentado acima, por exemplo, deveria ter estratificado os dados de reclamação por “novos” vs “experientes” para realizar a análise. Isto é, aproveitando o gancho, em nossas certificações Green Belt e Black Belt, exploramos muito a análise de dados.

Há diversos vídeos em que explicamos como fazer análises como esta, no Minitab, Power BI e no Excel. 

Por que não começa agora a construir o futuro que deseja? Comece pelos cursos gratuitos, você vai gostar!

Leia mais:

Virgilio F. M. dos Santos

Virgilio F. M. dos Santos

Sócio-fundador da FM2S, formado em Engenharia Mecânica pela Unicamp (2006), com mestrado e doutorado na Engenharia de Processos de Fabricação na FEM/UNICAMP (2007 a 2013) e Master Black Belt pela UNICAMP (2011). Foi professor dos cursos de Black Belt, Green Belt e especialização em Gestão e Estratégia de Empresas da UNICAMP, assim como de outras universidades e cursos de pós-graduação. Atuou como gerente de processos e melhoria em empresa de bebidas e foi um dos idealizadores do Desafio Unicamp de Inovação Tecnológica.