CAPÍTULO 2 A MÉDIA BEM ESCOLHIDA |
Acredito que você não seja um pernóstico, e eu, certamente, não estou no negócio de imóveis. Mas digamos que você seja, e eu esteja, e que você procure uma propriedade para comprar, numa estrada não distante do vale californiano em que vivo.
Tendo avaliado que você é um pernóstico, esforço-me para que saiba que a renda média nessa vizinhança é de 15.000 dólares por ano. Talvez isso faça com que você se decida a viver aqui. De qualquer modo, você compra, e aquele belo número (15.000!) fixa-se em sua mente. É muito provável, sendo você por definição um pernóstico, que o número seja mencionado casualmente em conversa com seus amigos.
Um ano depois, nos encontramos. Como membro de uma Comissão de Contribuintes estou passando um abaixo-assinado para que sejam mantidas baixas as avaliações dos imóveis, ou as passagens de ônibus, ou outra coisa qualquer. Meu argumento é que não podemos arcar com o aumento: afinal, a renda média nesta redondeza é de apenas 3.500 dólares por ano. Talvez você venha a aderir: além de pernóstico, você é também um unha-de-fome, mas a pobreza dos 3.500 o surpreende. Eu sou mentiroso agora ou no ano passado?
Eu, não!... Aqui está a beleza essencial de mentir-se com estatísticas! Ambos os números são legítimos, legalmente descobertos. Ambos representam os mesmos dados, as mesmas pessoas, as mesmas rendas. De qualquer forma, um ou outro deve ser tão enganador que equivale a uma deslavada mentira. Minha mágica foi usar uma espécie diferente de média de cada vez, já que a palavra média tem um significado muito elástico.
Esta mágica é largamente utilizada, às vezes inocentemente, às vezes de propósito, por sujeitos ou indivíduos pretendendo influenciar a opinião pública, ou mesmo para vender espaço para anúncios. Quando alguém lhe disser que "em média" isto e aquilo, você ainda estará sem saber quais das espécies normais de médias se trata, isto é, se é o caso de uma "média", de uma "moda" ou de uma "mediana".
O número "15.000" que usei quando precisei de um número grande, é uma média aritmética das rendas de todas as famílias da vizinhança. Obtém-se somando todas as rendas das famílias, e dividindo-se o resultado pelo número de famílias. Quando precisei do número menor, usei a mediana, que nos diz que metade das famílias em questão recebe mais de 3.500 e a outra metade recebe menos de 3.500. Poderia ter ainda usado a moda, que vem a ser, numa série de números, aquele que se encontra com mais freqüência.
Aqui, como sucede geralmente com números relativos a rendas, não ser bem explícito é geralmente ser incompreensível ou - pior - mal entendido. Modas, médias e medianas, em certas formas de informação, estão tão juntinhas que ao observador incauto não haverá diferença.
Se você lê que a altura dos homens de uma tribo primitiva é em média 1,5 metros, você terá uma idéia bem razoável de sua altura. Não há que indagar se, no caso, trata-se de médias, medianas ou modas; serão aproximadamente a mesma coisa. Claro que se você estiver no negócio de confecção de macacões para exportar para a África, serão necessárias mais informações do que as contidas em quaisquer médias ou medianas. Estas se relacionam aos desvios em relação à média, e serão abordadas em outro capitulo.
As diferentes "médias" aparecem juntas quando se lida com dados referentes a muitas características humanas, que graciosamente caem junto ao que se denomina "distribuição normal". Se uma curva for traçada num gráfico para representá-las, você verá que ela se parecerá com um sino - chamam-na elegantemente de "Curva do Sino" - e média, moda e mediana cairão no mesmo ponto.
Assim, uma espécie de "média" é tão boa como a outra, para descrever a altura de pessoas, mas isto não servirá para descrever suas carteiras. Se você fizer a lista da renda de todas as famílias numa certa cidade, poderá verificar que oscilam de "um pouquinho" até 50.000 dólares, talvez, e poderão ser achadas umas poucas que sejam bem altas. Mais de 95% estará abaixo de 10.000 dólares.
A curva, no gráfico, nada terá da simetria do sino, ficando bem mais semelhante ao perfil de um "escorregador" de parque infantil, com uma "escada" quase vertical, formando um pico, que desce, primeiro abruptamente, numa curva que vai ficando suave até encontrar aos poucos a horizontal. Em tal curva, a média verdadeira estará muito afastada da mediana.
Na vizinhança onde lhe vendi o tal imóvel, as duas "médias" estão bem separadas, porque a distribuição é bem assimétrica. Acontece que a maioria de seus vizinhos é de pequenos granjeiros ou empregados num vilarejo vizinho, ou velhotes aposentados. Três dos habitantes, entretanto, são milionários que passam o fim-de-semana aqui, e estes três elevam para as nuvens a renda total, mandando a média aritmética a uma altura extraordinária. A altura é tal que praticamente todos têm bem menos que a tal média. Na realidade, você está num caso que parece brincadeira, ou figura de retórica: Quase todos estão abaixo da média.
É por isso que quando você lê uma declaração de um industrial, de que o salário médio dos que trabalham na empresa é "de tanto", tal número pode significar algo, e pode não significar coisa alguma. Se a "média" é uma mediana, isto terá alguma significação: metade dos empregados ganha mais do que o tal número; metade ganha menos.
Mas se é o caso de uma média aritmética (e, creia-me, poderá vir mesmo a ser uma média aritmética, se não houver especificação clara a respeito!), a informação que lhe estão dando poderá revelar apenas que se trata de uma única renda de 45.000 dólares - a do dono - e os salários de uma turba de empregados sub-pagos. "Renda anual média de 5.700" pode esconder tanto os salários de 2.000 como os lucros do dono.
Examinemos o caso mais de perto. A página adiante mostra quantas pessoas ganham quanto. O patrão poderá querer exprimir a situação como "renda média de 5.700" - usando aquela média enganadora. A moda, entretanto, é mais reveladora: o nível de salário mais freqüente neste negócio é 2.000. Como costumeiro, a mediana nos diz mais sobre a situação do que qualquer outro número: metade do pessoal ganha mais de 3.000, e metade ganha menos.
Nas declarações e nos gráficos ilustrativos de muitas empresas, quanto pior a história, mais bonito o quadro. Vamos passar nosso pincel mágico numa dessas obras-primas.
Você é um dos três sócios numa pequena indústria. Estamos no fim de um excelente ano. Você pagou 198.000 dólares aos 90 empregados. Você e seus sócios retiraram, cada um, 11.000 dólares. Há um lucro de 45.000 a ser dividido entre os três. Como vão descrever isto? Para facilitar a explicação, ponha a coisa em forma de "médias". Como todos os empregados recebem o mesmo, aproximadamente, não fará muita diferença o uso de uma média ou de uma mediana. Eis o que surge:
Empregados, em média 2.200
Sócios, em média 26.000
Tem uma aparência horrível, não? Vamos tentar outra coisa. Apanhemos $30.000 dos lucros e vamos distribuir isto entre os sócios como gratificações. Agora, quando calcularmos os salários, incluam-se neles, junto com seus sócios. E não deixe de usar a média aritmética.
Salário médio 2.806,45
Lucro médio dos sócios 5.000,00
Ah!... Melhorou bastante. Poderíamos fazer melhor, mas já está razoável. Agora você já tem números que podem ser publicados, pregados no quadro de avisos ou usados para recusar aumentos.
Este exemplo é bem tosco, por ser simplificado, mas é de sublime simplicidade, comparado ao que têm sido perpetrado em nome da contabilidade. Numa empresa complexa, com hierarquias de empregados que se estende da datilógrafa principiante ao diretor-presidente, com gratificações de várias centenas de milhares de dólares, muita coisa poderá ser oculta dessa maneira.
Portanto, quando encontrar um número de pagamento médio, pergunte primeiro: "Médio de quê? Quem está incluído?"
Certa ocasião, a United States Steel Corporation declarou que a renda semanal média de seus empregados subiu 107% entre 1940 e 1948. É verdade - mas este magnífico aumento fica prejudicado quando se nota que o número de 1940 inclui um número muito maior de empregados em tempo parcial. Se você trabalha em meio-expediente num ano, e expediente integral no outro, sua renda duplicará, mais isto nada modificará a escala do seu salário.
Você poderá ter lido nos jornais que a renda da família média americana era de 3.100 dólares anuais em 1949. Não tente descobrir muito sobre tal número, a menos que você também saiba qual "família" foi usada como "média", e que espécie de média é esta. E quem diz isso? E qual a precisão do número?
Acontece que este número veio do Bureau do Censo. Se você tiver o relatório do Bureau, não terá dificuldade em descobrir o resto da informação de que precisa, ali mesmo: Trata-se de uma mediana. "Família" significa "duas ou mais pessoas relacionadas uma com a outra e vivendo juntas". Caso fossem incluídas no grupo as pessoas que vivem sozinhas, a mediana cairia para 2.700 dólares, o que é bem diferente. Dando-se ao trabalho de ler as tabelas, você também aprenderá que o número baseia-se numa amostra de tamanho tal que há 19 chances em 20 de que a estimativa - 3.107 dólares, antes de ser arredondada - esteja correta, com margem de erro de 59 dólares para mais ou para menos.
Tal probabilidade, e a margem, asseguram uma boa estimativa. O pessoal do Censo tem bastante qualificação e dinheiro para levar seus estudos de amostragem a um grau aceitável de precisão. Presume-se que não tenham que mentir a ninguém. Nem todos os números que você vê, nascem em circunstâncias tão felizes, nem são sempre acompanhados de informações adicionais, que mostrem quão precisos ou imprecisos podem ser. Este ponto abordaremos no próximo capitulo.
Enquanto isso, experimente seu ceticismo em alguns itens de uma "Carta do Editor" na revista Time. Quanto aos novos assinantes, diz a carta: "Sua idade mediana é de 34 anos, e sua renda familiar em média é de 7.270 dólares anuais". Ora, uma pesquisa anterior tinha revelado que sua "idade mediana era de 41 anos... renda de 9.535 em média..." A pergunta natural é: Por que, quando é dada a médiana para a idade em ambos os casos, a espécie de média para rendas fica cuidadosamente não-especificada? Será que a média aritmética foi usada por ser maior, parecendo assim balançar com um corpo de leitores mais ricos na ponta do anzol, para fisgar os anunciantes?
Experimente você também o jogo "que-espécie-de-média-você-é", na base da alegada prosperidade dos Yaleianos de 1924.