Medidas de Posição

Nesta aula o foco são as medidas de posição — também chamadas de medidas de tendência central. São os valores que resumem um conjunto de dados em um único número representativo, respondendo à pergunta: "onde está o centro dessa distribuição?". O conteúdo é bastante calculístico, então a estratégia ideal de estudo é compreender os conceitos e resolver bastantes exercícios.

🎯 1. O que são Medidas de Posição?

Medidas de posição (ou tendência central) são valores que representam o conjunto de dados, indicando em torno de qual ponto os dados se concentram. As três principais são: média aritmética, moda e mediana. Os quartis ampliam esse conceito, dividindo a distribuição em partes iguais. Cada uma responde a uma pergunta diferente e tem aplicações e limitações distintas.

➕ 2. Média Aritmética

📌 2.1 Média Aritmética Simples

É a soma de todos os valores dividida pela quantidade de elementos. É a medida de posição mais usada e mais sensível a valores extremos (outliers).

Para dados não agrupados: \( \bar{x} = \dfrac{\displaystyle\sum_{i=1}^{n} x_i}{n} \)

Exemplo: receitas de cinco contribuintes (em R$ mil): 20, 30, 40, 50, 60. Média: \( \bar{x} = (20+30+40+50+60)/5 = 200/5 = 40 \).

⚠️ Sensibilidade a outliers: Se um dos contribuintes tiver receita de R$ 500 mil em vez de R$ 60 mil, a média sobe para R$ 128 mil — valor que não representa bem os demais. Esse é o principal ponto fraco da média e justifica o uso da mediana em distribuições assimétricas.

📌 2.2 Média Aritmética Ponderada

Usada quando cada valor tem um peso diferente, refletindo sua importância relativa no conjunto.

\( \bar{x}_p = \dfrac{\displaystyle\sum_{i=1}^{n} x_i \cdot w_i}{\displaystyle\sum_{i=1}^{n} w_i} \)

Exemplo: um auditor avalia três relatórios com notas 7, 8 e 9, com pesos 1, 2 e 3 respectivamente. \( \bar{x}_p = (7 \times 1 + 8 \times 2 + 9 \times 3)/(1+2+3) = (7+16+27)/6 = 50/6 \approx 8{,}33 \).

💡 Dica importante: A média de dados agrupados em classes é um caso especial de média ponderada, onde os pesos são as frequências absolutas e os valores são os pontos médios das classes: \( \bar{x} = \sum(x_i \cdot f_i) / n \).

📌 2.3 Propriedades da Média — Cobradas em Prova

  • A soma dos desvios em relação à média é sempre zero: \( \sum(x_i - \bar{x}) = 0 \)
  • Se somarmos (ou subtrairmos) uma constante \( k \) a todos os valores, a média também soma (ou subtrai) \( k \)
  • Se multiplicarmos todos os valores por uma constante \( k \), a média também é multiplicada por \( k \)
  • A média é única para um dado conjunto de dados

⚠️ Pegadinha clássica: A média de médias não é igual à média geral quando os grupos têm tamanhos diferentes. Para calcular a média geral de dois grupos, é preciso usar a média ponderada pelos tamanhos dos grupos.

🎩 3. Moda

A moda é o valor (ou classe) que ocorre com maior frequência no conjunto de dados. Não exige cálculo aritmético — é identificada por observação ou pela classe de maior frequência absoluta.

  • Amodal: nenhum valor se repete (sem moda)
  • Unimodal: apenas um valor é o mais frequente
  • Bimodal: dois valores com a mesma frequência máxima
  • Plurimodal (multimodal): mais de dois valores com frequência máxima igual

📌 3.1 Moda para Dados Agrupados — Fórmula de Czuber

Para distribuições agrupadas em classes, a moda está dentro da classe modal (a de maior frequência). O valor exato é estimado pela fórmula de Czuber:

\( Mo = L_i + \left( \dfrac{\Delta_1}{\Delta_1 + \Delta_2} \right) \cdot h \)

onde \( L_i \) é o limite inferior da classe modal, \( \Delta_1 = f_{modal} - f_{anterior} \), \( \Delta_2 = f_{modal} - f_{posterior} \) e \( h \) é a amplitude da classe.

💡 Dica de prova: Para concursos de auditoria, a moda em dados agrupados é cobrada principalmente pela identificação da classe modal (a de maior frequência absoluta), e a fórmula de Czuber aparece em provas mais exigentes. Saiba identificar a classe modal e aplicar a fórmula se o enunciado pedir o valor exato.

📍 4. Mediana

A mediana é o valor que divide o conjunto ordenado ao meio — 50% dos dados ficam abaixo e 50% acima. É robusta a outliers, por isso é preferida em distribuições assimétricas (renda, patrimônio, valores de autuações).

📌 4.1 Mediana para Dados Não Agrupados

Primeiramente, ordene os dados em ordem crescente. Depois:

  • Se \( n \) é ímpar: a mediana é o elemento na posição \( (n+1)/2 \)
  • Se \( n \) é par: a mediana é a média aritmética dos dois elementos centrais, nas posições \( n/2 \) e \( n/2 + 1 \)

Exemplo com \( n = 7 \): dados ordenados 10, 15, 20, 25, 30, 35, 40. Posição central: \( (7+1)/2 = 4 \). Mediana = 25.

Exemplo com \( n = 6 \): dados ordenados 10, 15, 20, 25, 30, 35. Posições 3 e 4: valores 20 e 25. Mediana = \( (20+25)/2 = 22{,}5 \).

📌 4.2 Mediana para Dados Agrupados

Para distribuições em tabela de frequências, a mediana está na classe que contém o elemento de posição \( n/2 \) na frequência acumulada. O valor exato é calculado por interpolação linear:

\( Md = L_i + \left( \dfrac{n/2 - F_{ant}}{f_{md}} \right) \cdot h \)

onde \( L_i \) é o limite inferior da classe mediana, \( F_{ant} \) é a frequência acumulada da classe anterior à mediana, \( f_{md} \) é a frequência absoluta da classe mediana e \( h \) é a amplitude da classe.

⚠️ Atenção ao \( n/2 \): Alguns autores e bancas usam \( (n+1)/2 \) para localizar a classe mediana em dados agrupados. O mais comum em provas brasileiras é \( n/2 \). Verifique qual convenção o enunciado adota quando apresentar os dados.

📋 Aplicação prática: A mediana de renda domiciliar per capita é a medida usada pelo IBGE para caracterizar o padrão de vida — exatamente porque a renda tem distribuição assimétrica à direita (poucos com renda muito alta), e a média superestimaria o padrão típico. O mesmo raciocínio vale para análise de valores de autuações fiscais.

📐 5. Quartis, Decis e Percentis

📌 5.1 Quartis

Os quartis dividem a distribuição ordenada em quatro partes iguais, cada uma com 25% dos dados:

  • \( Q_1 \) (primeiro quartil): 25% dos dados estão abaixo — posição \( n/4 \)
  • \( Q_2 \) (segundo quartil): 50% dos dados estão abaixo — coincide com a mediana — posição \( n/2 \)
  • \( Q_3 \) (terceiro quartil): 75% dos dados estão abaixo — posição \( 3n/4 \)

A diferença \( Q_3 - Q_1 \) é chamada de intervalo interquartil (IIQ) e mede a dispersão dos 50% centrais dos dados — será estudado em Medidas de Dispersão.

📌 5.2 Decis e Percentis

  • Decis: dividem a distribuição em 10 partes iguais (D1 a D9). O quinto decil \( D_5 \) coincide com a mediana e com \( Q_2 \).
  • Percentis: dividem a distribuição em 100 partes iguais (P1 a P99). \( P_{25} = Q_1 \), \( P_{50} = Q_2 = Md \), \( P_{75} = Q_3 \).

💡 Relação entre as medidas: \( P_{50} = D_5 = Q_2 = Md \). Bancas adoram perguntar qual separatriz coincide com a mediana — memorize essa equivalência.

📌 5.3 Fórmula Geral para Quartis em Dados Agrupados

A mesma lógica de interpolação usada na mediana se aplica a qualquer quartil. Para o quartil \( Q_k \):

\( Q_k = L_i + \left( \dfrac{k \cdot n/4 - F_{ant}}{f_{Q_k}} \right) \cdot h \)

onde \( k = 1, 2 \) ou \( 3 \) para \( Q_1, Q_2 \) ou \( Q_3 \) respectivamente.

⚖️ 6. Comparação entre as Medidas de Posição

  • Média: usa todos os valores; sensível a outliers; única; permite operações algébricas
  • Mediana: robusta a outliers; divide os dados ao meio; preferida em distribuições assimétricas
  • Moda: não exige cálculo; pode não existir ou ser múltipla; única medida válida para variáveis qualitativas nominais
  • Quartis: complementam a mediana; base do boxplot; descrevem a dispersão central

💡 Qual medida usar? Variável qualitativa nominal → moda. Distribuição assimétrica ou com outliers → mediana. Distribuição simétrica sem outliers → média. Em provas, a banca muitas vezes descreve a situação e pede qual medida é mais adequada — esse é o raciocínio esperado.

⚠️ Relação com assimetria (revisão): Em distribuição simétrica: \( \bar{x} = Md = Mo \). Assimétrica positiva (cauda à direita): \( Mo < Md < \bar{x} \). Assimétrica negativa (cauda à esquerda): \( \bar{x} < Md < Mo \). Esse é um dos temas mais cobrados em questões de análise de gráficos.

🗂️ Resumo Final — O que ler na véspera da prova

  • Média simples: \( \bar{x} = \sum x_i / n \) — sensível a outliers
  • Média ponderada: \( \bar{x}_p = \sum(x_i \cdot w_i) / \sum w_i \) — pesos refletem importância relativa
  • Média de dados agrupados: \( \bar{x} = \sum(x_i \cdot f_i) / n \) — usa ponto médio da classe como representante
  • Propriedade: \( \sum(x_i - \bar{x}) = 0 \) — soma dos desvios em relação à média é sempre zero
  • Média de grupos diferentes: usar média ponderada pelos tamanhos — média de médias não é a média geral
  • Moda: valor ou classe de maior frequência — pode ser amodal, unimodal, bimodal ou plurimodal
  • Moda em dados agrupados (Czuber): \( Mo = L_i + \frac{\Delta_1}{\Delta_1 + \Delta_2} \cdot h \)
  • Mediana com n ímpar: elemento na posição \( (n+1)/2 \) dos dados ordenados
  • Mediana com n par: média dos elementos nas posições \( n/2 \) e \( n/2 + 1 \)
  • Mediana em dados agrupados: \( Md = L_i + \frac{n/2 - F_{ant}}{f_{md}} \cdot h \)
  • \( Q_2 = Md = D_5 = P_{50} \) — todas coincidem com a mediana
  • Intervalo interquartil: \( IIQ = Q_3 - Q_1 \) — dispersão dos 50% centrais
  • Simétrica: \( \bar{x} = Md = Mo \)
  • Assimétrica positiva (cauda à direita): \( Mo < Md < \bar{x} \)
  • Assimétrica negativa (cauda à esquerda): \( \bar{x} < Md < Mo \)
  • Variável qualitativa nominal → única medida de posição válida é a moda

Exercícios de Fixação

Questão 1 de 20

Compartilhe nos comentários suas dúvidas, sugestões, críticas e elogios sobre esse conteúdo!👇

Comentários