Medidas de Posição
Nesta aula o foco são as medidas de posição — também chamadas de medidas de tendência central. São os valores que resumem um conjunto de dados em um único número representativo, respondendo à pergunta: "onde está o centro dessa distribuição?". O conteúdo é bastante calculístico, então a estratégia ideal de estudo é compreender os conceitos e resolver bastantes exercícios.
🎯 1. O que são Medidas de Posição?
Medidas de posição (ou tendência central) são valores que representam o conjunto de dados, indicando em torno de qual ponto os dados se concentram. As três principais são: média aritmética, moda e mediana. Os quartis ampliam esse conceito, dividindo a distribuição em partes iguais. Cada uma responde a uma pergunta diferente e tem aplicações e limitações distintas.
➕ 2. Média Aritmética
📌 2.1 Média Aritmética Simples
É a soma de todos os valores dividida pela quantidade de elementos. É a medida de posição mais usada e mais sensível a valores extremos (outliers).
Para dados não agrupados: \( \bar{x} = \dfrac{\displaystyle\sum_{i=1}^{n} x_i}{n} \)
Exemplo: receitas de cinco contribuintes (em R$ mil): 20, 30, 40, 50, 60. Média: \( \bar{x} = (20+30+40+50+60)/5 = 200/5 = 40 \).
⚠️ Sensibilidade a outliers: Se um dos contribuintes tiver receita de R$ 500 mil em vez de R$ 60 mil, a média sobe para R$ 128 mil — valor que não representa bem os demais. Esse é o principal ponto fraco da média e justifica o uso da mediana em distribuições assimétricas.
📌 2.2 Média Aritmética Ponderada
Usada quando cada valor tem um peso diferente, refletindo sua importância relativa no conjunto.
\( \bar{x}_p = \dfrac{\displaystyle\sum_{i=1}^{n} x_i \cdot w_i}{\displaystyle\sum_{i=1}^{n} w_i} \)
Exemplo: um auditor avalia três relatórios com notas 7, 8 e 9, com pesos 1, 2 e 3 respectivamente. \( \bar{x}_p = (7 \times 1 + 8 \times 2 + 9 \times 3)/(1+2+3) = (7+16+27)/6 = 50/6 \approx 8{,}33 \).
💡 Dica importante: A média de dados agrupados em classes é um caso especial de média ponderada, onde os pesos são as frequências absolutas e os valores são os pontos médios das classes: \( \bar{x} = \sum(x_i \cdot f_i) / n \).
📌 2.3 Propriedades da Média — Cobradas em Prova
- A soma dos desvios em relação à média é sempre zero: \( \sum(x_i - \bar{x}) = 0 \)
- Se somarmos (ou subtrairmos) uma constante \( k \) a todos os valores, a média também soma (ou subtrai) \( k \)
- Se multiplicarmos todos os valores por uma constante \( k \), a média também é multiplicada por \( k \)
- A média é única para um dado conjunto de dados
⚠️ Pegadinha clássica: A média de médias não é igual à média geral quando os grupos têm tamanhos diferentes. Para calcular a média geral de dois grupos, é preciso usar a média ponderada pelos tamanhos dos grupos.
🎩 3. Moda
A moda é o valor (ou classe) que ocorre com maior frequência no conjunto de dados. Não exige cálculo aritmético — é identificada por observação ou pela classe de maior frequência absoluta.
- Amodal: nenhum valor se repete (sem moda)
- Unimodal: apenas um valor é o mais frequente
- Bimodal: dois valores com a mesma frequência máxima
- Plurimodal (multimodal): mais de dois valores com frequência máxima igual
📌 3.1 Moda para Dados Agrupados — Fórmula de Czuber
Para distribuições agrupadas em classes, a moda está dentro da classe modal (a de maior frequência). O valor exato é estimado pela fórmula de Czuber:
\( Mo = L_i + \left( \dfrac{\Delta_1}{\Delta_1 + \Delta_2} \right) \cdot h \)
onde \( L_i \) é o limite inferior da classe modal, \( \Delta_1 = f_{modal} - f_{anterior} \), \( \Delta_2 = f_{modal} - f_{posterior} \) e \( h \) é a amplitude da classe.
💡 Dica de prova: Para concursos de auditoria, a moda em dados agrupados é cobrada principalmente pela identificação da classe modal (a de maior frequência absoluta), e a fórmula de Czuber aparece em provas mais exigentes. Saiba identificar a classe modal e aplicar a fórmula se o enunciado pedir o valor exato.
📍 4. Mediana
A mediana é o valor que divide o conjunto ordenado ao meio — 50% dos dados ficam abaixo e 50% acima. É robusta a outliers, por isso é preferida em distribuições assimétricas (renda, patrimônio, valores de autuações).
📌 4.1 Mediana para Dados Não Agrupados
Primeiramente, ordene os dados em ordem crescente. Depois:
- Se \( n \) é ímpar: a mediana é o elemento na posição \( (n+1)/2 \)
- Se \( n \) é par: a mediana é a média aritmética dos dois elementos centrais, nas posições \( n/2 \) e \( n/2 + 1 \)
Exemplo com \( n = 7 \): dados ordenados 10, 15, 20, 25, 30, 35, 40. Posição central: \( (7+1)/2 = 4 \). Mediana = 25.
Exemplo com \( n = 6 \): dados ordenados 10, 15, 20, 25, 30, 35. Posições 3 e 4: valores 20 e 25. Mediana = \( (20+25)/2 = 22{,}5 \).
📌 4.2 Mediana para Dados Agrupados
Para distribuições em tabela de frequências, a mediana está na classe que contém o elemento de posição \( n/2 \) na frequência acumulada. O valor exato é calculado por interpolação linear:
\( Md = L_i + \left( \dfrac{n/2 - F_{ant}}{f_{md}} \right) \cdot h \)
onde \( L_i \) é o limite inferior da classe mediana, \( F_{ant} \) é a frequência acumulada da classe anterior à mediana, \( f_{md} \) é a frequência absoluta da classe mediana e \( h \) é a amplitude da classe.
⚠️ Atenção ao \( n/2 \): Alguns autores e bancas usam \( (n+1)/2 \) para localizar a classe mediana em dados agrupados. O mais comum em provas brasileiras é \( n/2 \). Verifique qual convenção o enunciado adota quando apresentar os dados.
📋 Aplicação prática: A mediana de renda domiciliar per capita é a medida usada pelo IBGE para caracterizar o padrão de vida — exatamente porque a renda tem distribuição assimétrica à direita (poucos com renda muito alta), e a média superestimaria o padrão típico. O mesmo raciocínio vale para análise de valores de autuações fiscais.
📐 5. Quartis, Decis e Percentis
📌 5.1 Quartis
Os quartis dividem a distribuição ordenada em quatro partes iguais, cada uma com 25% dos dados:
- \( Q_1 \) (primeiro quartil): 25% dos dados estão abaixo — posição \( n/4 \)
- \( Q_2 \) (segundo quartil): 50% dos dados estão abaixo — coincide com a mediana — posição \( n/2 \)
- \( Q_3 \) (terceiro quartil): 75% dos dados estão abaixo — posição \( 3n/4 \)
A diferença \( Q_3 - Q_1 \) é chamada de intervalo interquartil (IIQ) e mede a dispersão dos 50% centrais dos dados — será estudado em Medidas de Dispersão.
📌 5.2 Decis e Percentis
- Decis: dividem a distribuição em 10 partes iguais (D1 a D9). O quinto decil \( D_5 \) coincide com a mediana e com \( Q_2 \).
- Percentis: dividem a distribuição em 100 partes iguais (P1 a P99). \( P_{25} = Q_1 \), \( P_{50} = Q_2 = Md \), \( P_{75} = Q_3 \).
💡 Relação entre as medidas: \( P_{50} = D_5 = Q_2 = Md \). Bancas adoram perguntar qual separatriz coincide com a mediana — memorize essa equivalência.
📌 5.3 Fórmula Geral para Quartis em Dados Agrupados
A mesma lógica de interpolação usada na mediana se aplica a qualquer quartil. Para o quartil \( Q_k \):
\( Q_k = L_i + \left( \dfrac{k \cdot n/4 - F_{ant}}{f_{Q_k}} \right) \cdot h \)
onde \( k = 1, 2 \) ou \( 3 \) para \( Q_1, Q_2 \) ou \( Q_3 \) respectivamente.
⚖️ 6. Comparação entre as Medidas de Posição
- Média: usa todos os valores; sensível a outliers; única; permite operações algébricas
- Mediana: robusta a outliers; divide os dados ao meio; preferida em distribuições assimétricas
- Moda: não exige cálculo; pode não existir ou ser múltipla; única medida válida para variáveis qualitativas nominais
- Quartis: complementam a mediana; base do boxplot; descrevem a dispersão central
💡 Qual medida usar? Variável qualitativa nominal → moda. Distribuição assimétrica ou com outliers → mediana. Distribuição simétrica sem outliers → média. Em provas, a banca muitas vezes descreve a situação e pede qual medida é mais adequada — esse é o raciocínio esperado.
⚠️ Relação com assimetria (revisão): Em distribuição simétrica: \( \bar{x} = Md = Mo \). Assimétrica positiva (cauda à direita): \( Mo < Md < \bar{x} \). Assimétrica negativa (cauda à esquerda): \( \bar{x} < Md < Mo \). Esse é um dos temas mais cobrados em questões de análise de gráficos.
🗂️ Resumo Final — O que ler na véspera da prova
- Média simples: \( \bar{x} = \sum x_i / n \) — sensível a outliers
- Média ponderada: \( \bar{x}_p = \sum(x_i \cdot w_i) / \sum w_i \) — pesos refletem importância relativa
- Média de dados agrupados: \( \bar{x} = \sum(x_i \cdot f_i) / n \) — usa ponto médio da classe como representante
- Propriedade: \( \sum(x_i - \bar{x}) = 0 \) — soma dos desvios em relação à média é sempre zero
- Média de grupos diferentes: usar média ponderada pelos tamanhos — média de médias não é a média geral
- Moda: valor ou classe de maior frequência — pode ser amodal, unimodal, bimodal ou plurimodal
- Moda em dados agrupados (Czuber): \( Mo = L_i + \frac{\Delta_1}{\Delta_1 + \Delta_2} \cdot h \)
- Mediana com n ímpar: elemento na posição \( (n+1)/2 \) dos dados ordenados
- Mediana com n par: média dos elementos nas posições \( n/2 \) e \( n/2 + 1 \)
- Mediana em dados agrupados: \( Md = L_i + \frac{n/2 - F_{ant}}{f_{md}} \cdot h \)
- \( Q_2 = Md = D_5 = P_{50} \) — todas coincidem com a mediana
- Intervalo interquartil: \( IIQ = Q_3 - Q_1 \) — dispersão dos 50% centrais
- Simétrica: \( \bar{x} = Md = Mo \)
- Assimétrica positiva (cauda à direita): \( Mo < Md < \bar{x} \)
- Assimétrica negativa (cauda à esquerda): \( \bar{x} < Md < Mo \)
- Variável qualitativa nominal → única medida de posição válida é a moda
Exercícios de Fixação
Compartilhe nos comentários suas dúvidas, sugestões, críticas e elogios sobre esse conteúdo!👇
Comentários
Postar um comentário