Mediana-Média-Moda
Análise de dados

10 de setembro de 2017

Última atualização: 18 de abril de 2023

O que é mediana, média, moda em estatística?

A mediana é uma medida de tendência central em estatística. Ela representa o valor que divide uma amostra ou conjunto de dados ordenados em dois grupos de números de elementos iguais.

Em outras palavras, mediana é o valor que se encontra no meio de uma série de dados ordenados. 

O que é média?

A média é essencialmente um modelo do seu conjunto de dados. É o valor mais comum.

Você notará, no entanto, que a média geralmente não é um dos valores reais que você observou em seu conjunto de dados. No entanto, uma de suas propriedades importantes é que ele minimiza o erro na previsão de qualquer valor em seu conjunto de dados. Ou seja, é o valor que produz a menor quantidade de erro de todos os outros valores no conjunto de dados.

Uma propriedade importante da média é que ele inclui todos os valores em seu conjunto de dados como parte do cálculo. Além disso, a média é a única medida de tendência central em que a soma dos desvios de cada valor da média é sempre zero.

A média tem uma desvantagem principal: é particularmente suscetível à influência de outliers. Estes são valores incomuns em comparação com o resto do conjunto de dados, sendo especialmente pequenos ou grandes em valor numérico.

Com a certificação Black Belt, conquiste sólido conhecimento das ferramentas da metodologia, além de competências para coordenar pessoas e projetos de melhoria que irão impactar os indicadores da organização em que você atua. Torne-se um especialista em Lean Seis Sigma. 

Curso Black Belt Promoção

O que é Mediana? 

A mediana de um conjunto de números é em que metade dos números são mais baixos e a metade dos números são maiores.

Por exemplo, no caso imobiliário, isso significa que a mediana é o preço em que a metade das casas vendidas naquele mês era mais barata e a metade era mais cara.

Se o número da quantidade de elementos é par, a gente calcula a mediana pela média aritmética dos dois valores centrais. Se o número de observações é uma quantidade ímpar, a mediana é o valor central. A mediana é menos afetada por valores extremos (outliers) do que a média aritmética. 

Qual a diferença entre Mediana e Média?

A média de um conjunto de números é o total dos números dessa quantidade de elementos divididos pelo número de itens nesse conjunto. A mediana e a média podem estar próximas ou não. Tudo depende dos números.

Quando geralmente preferimos a mediana sobre a média (ou moda) é quando nossos dados estão distorcidos (ou seja, a distribuição de frequência para nossos dados está distorcida). 

Se considerarmos a distribuição normal - como esta é a mais frequentemente avaliada em estatísticas - quando os dados são perfeitamente normais, a média, a moda e a mediana são idênticos. Além disso, representam o valor mais típico no conjunto de dados. 

No entanto, à medida que os dados se desviam, seja em ordem crescente ou decrescente, a média perde sua capacidade de fornecer a melhor localização central para os dados porque os dados distorcidos estão arrastando-o para longe do valor típico. Nesses casos, é a mediana que melhor conserva essa posição e não é tão fortemente influenciada pelos valores distorcidos.

Exemplo:

Aqui estão 11 preços de apartamentos.

  • R$ 100,000
  • R$ 101,000
  • R$ 102,000
  • R$ 103,000
  • R$ 104,000
  • R$ 105,000
  • R$ 106,000
  • R$ 107,000
  • R$ 650,000
  • R$ 1.000.000
  • R$ 3.000.000

A mediana dos preços desses 11 apartamentos é de R$ 105.000. Cinco apartamentos eram de preço mais baixo e cinco apartamentos tinham preços mais altos. O preço médio desses 11 apartamentos é de R$ 498.000. Isso é o que você obtém se somar todos esses preços e dividir por 11.

Que diferença! Quando você está olhando para os preços das casas, certifique-se de saber se os números são médias ou medianas. Ambos os números fornecem boa informação, mas eles têm implicações diferentes.

Quais as outras diferenças?

Embora a média seja uma estatística comumente utilizada e bem compreendida, a mediana também é um descritor comum usado para expressar um valor "médio" em um conjunto de dados. Esse valor "médio" também é conhecido como a tendência central. A mediana é determinada ao classificar os dados do maior ao menor, e depois identificar o meio para que haja um número igual de valores de dados maiores e menores do que é.

Enquanto a média e a mediana podem ser iguais ou quase iguais, elas são diferentes se os valores dos dados estiverem agrupados em direção a uma extremidade de seu alcance e/ou se houver alguns valores extremos. 

Na terminologia estatística, isso se chama "skewness". Neste caso, a média pode ser significativamente influenciada pelos poucos valores, o que não é muito representativo da maioria dos valores no conjunto de dados. Nessas circunstâncias, a mediana dá uma melhor representação da tendência central do que a média.

O que é moda?

A moda é a pontuação mais frequente em nosso conjunto de dados.

Em um histograma, representa a barra mais alta do gráfico. Você pode, portanto, considerar a moda como sendo a opção mais popular. Normalmente, a moda é usada para dados categóricos onde desejamos saber qual é a categoria mais comum.

No entanto, um dos problemas com a moda é que ela não é única, então nos deixa com problemas quando temos dois ou mais valores que compartilham a frequência mais alta.

Agora, estamos presos quanto a moda que melhor descreve a tendência central dos dados. Isso é particularmente problemático quando temos dados contínuos, porque é mais provável que não possamos ter um valor mais frequente do que o outro. 

Por exemplo, considere medir o peso de 30 pessoas (para 0,1 kg mais próximo). Quão provável é que encontremos duas ou mais pessoas com exatamente o mesmo peso (por exemplo, 67,4 kg)? 

A resposta  é muito improvável - pessoas podem estar perto, mas com uma amostra tão pequena (30 pessoas) e uma grande variedade de pesos possíveis, é improvável que você encontre duas pessoas exatamente com o mesmo peso, isto é, aos 0,1 kg mais próximos. É por isso que a moda é muito raramente usada com dados contínuos.

Leia Mais:

Google Lens: a ferramenta que você precisa conhecer em 2023

O que é globalização e quais seus impactos no mundo?

Virgilio Marques Dos Santos

Virgilio Marques Dos Santos

Sócio-fundador da FM2S, formado em Engenharia Mecânica pela Unicamp (2006), com mestrado e doutorado na Engenharia de Processos de Fabricação na FEM/UNICAMP (2007 a 2013) e Master Black Belt pela UNICAMP (2011). Foi professor dos cursos de Black Belt, Green Belt e especialização em Gestão e Estratégia de Empresas da UNICAMP, assim como de outras universidades e cursos de pós-graduação. Atuou como gerente de processos e melhoria em empresa de bebidas e foi um dos idealizadores do Desafio Unicamp de Inovação Tecnológica.