100.gif (12780 bytes)

 

COMO ESTATISTICULIZAR

Mal informar o povo pelo uso de matéria estatística poder-se-ia chamar "manipulação da estatística." Numa outra palavra (ainda que não muito própria): "estatisticulização".

O titulo deste livro, e de alguns dos assuntos nele contidos, parecem indicar que tais manobras são todas produto de uma intenção de enganar. O presidente de uma seção da Sociedade Americana de Estatística, certa vez, já me censurou por isso, "Muitas vezes, nem tudo é golpe baixo," disse ele, "mas sim incompetência." Pode haver algo no que ele diz, mas não estou certo que esta presunção seja menos ofensiva, para os estatisticos, que a outra.

Dizem que o autor Louis Bromfield tem uma resposta pronta para os que escrevem criticando-o, quando sua correspondência está muito grande para uma atenção pessoal. Sem fazer concessões nem encorajar maiores trocas de cartas, satisfaz a quase todos. A frase chave: "Pode haver algo no que você diz".

Lembra-me o pastor que desfrutava de grande popularidade, entre as senhoras mães na sua congregação, por seus elogios aos bebês trazidos para o batismo. Mas, depois, ao conversarem, as mães não conseguiam se lembrar do que o pastor havia dito, somente que fora "algo agradável". Para concluir, a invariável observação dele era, "Puxa vida" (radiante) "Este é um bebê, não é ?"

Possivelmente, o mais importante é lembrar que a distorção do dado estatístico e sua manipulação para determinado fim não são sempre obra de profissionais da Estatística. O que vem cheio de virtude, lá da mesa dos estatísticos, pode ser torcido, exagerado, simplificado e distorcido -- por seleção -- pelos comerciantes, peritos em relações públicas, jornalistas ou propagandistas.

Mas quem quer que seja o culpado, em qualquer instância, é difícil outorgar-lhe a posição de total inocência. Gráficos falsos nas revistas e jornais, que frequentemente fazem sensacionalismo pelo exagero, raramente diminuem qualquer coisa. Na minha experiência, aqueles que apresentam argumentos estatísticos em favor da indústria raramente dão aos trabalhadores ou aos consumidores uma melhor visão dos fatos: dão-na frequentemente a pior. Quando um sindicato contratou um estatístico tão incompetente a ponto de enfraquecer as reinvindicações dos trabalhadores?

Quando os erros permanecem todos de um só lado, não é fácil atribuí-los a falha ou a acidente. Um dos mais ardilosos modos de desvirtuar o dado estatístico é por meio de um gráfico. Um gráfico introduz uma gama de variáveis na qual os fatos podem ser escondidos e a relação desvirtuada. Meu trunfo predileto nesse campo é "A Sombra Obscurecedora". Há pouco tempo, foi distribuido pelo Banco de Boston, e amplamente divulgado entre os grupos de contribuintes, jornais e revistas, entre elas a Newsweek. O mapa mostrava que porção de nossa renda nacional estava sendo captada e aplicada pelo Governo Federal. Fez isso escurecendo a área dos estados a oeste do Mississipi (somente excetuando a Luisiana, o Arkansas e parte do Missouri) para indicar que os gastos federais tornaram-se iguais à renda total da população daqueles estados.

A fraude repousa na escolha de estados possuidores de grandes áreas mas, devido à população escassa, com renda relativamente pequena. Com igual honestidade (e igual desonestidade) o autor do mapa deveria ter iniciado sombreando Nova York ou a Nova Inglaterra, e assim obteria uma sombra vastamente menor e menos expressiva. Usando o mesmo dado, teria produzido uma impressão diversa na mente de quem quer que olhasse o mapa. Todavia, ninguém iria se preocupar em distribuir tal mapa. Pelo menos, não conheço nenhum grupo poderoso que esteja interessado em fazer com que o gasto com o público pareça menor do que realmente é.

Se o objetivo do autor do mapa fosse simplesmente informar, poderia tê-lo feito facilmente. Escolheria um grupo de estados intermediários, cuja área esteja para a área total do país assim como sua renda esteja para a renda nacional.

103.gif (35123 bytes)

Este mapa é um esforço particularmente flagrante para enganar, por usar um truque surrado. É algo clássico. O mesmo Banco, há bastante tempo, publicou versões desse mapa para mostrar os gastos federais em 1929 e 1937, e estes reapareceram como horríveis exemplos num livro padrão: Graphic Presentation (Apresentação de Gráficos), por Willard Cope Brinton. Este método "distorce os fatos", disse Brinton francamente. Mas o Banco de Boston continua a desenhar seus mapas e o Newsweek e outros, que deveriam melhor saber - e possivelmente o sabem - continuam a reproduzí-los sem ressalvas ou desculpas.

Qual a renda média das familias americanas? Como notamos anteriormente, para 1949, o Bureau do Censo diz que "a renda da família média era de $3.100". Mas lendo um artigo de jornal sobre "doação filantrópica," feita pela Fundação Russel Sage, vemos que, para o mesmo ano, a renda atingiu um notável $5.004. Possivelmente você ficaria satisfeito em saber que as pessoas estavam ganhando tão bem, mas deve ter se espantado ao comparar aquele número com suas próprias observações. Provavelmente você conhece as pessoas erradas.

Como pode Russel Sage e o Bureau do Censo estarem tão longe um do outro? O Bureau fala em médianas, como deveria ser, é claro, mas, mesmo se o pessoal da Sage estivesse usando uma média, a diferença não deveria ser tão grande. A Fundação Russel Sage, foi revelado depois, descobriu essa notável prosperidade apresentando o que só pode ser descrito como uma falsa família. Seu método, explicam (quando se lhes pede explicação), foi dividir o total da renda do povo americano por 149.000.000 para conseguir uma média de $ 1.251 para cada pessoa. "A qual", acrescentam, "torna-se $5.004 numa família de quatro".

104.gif (25447 bytes)

Essa curiosa peça de manipulação estatística exagera de duas maneiras. Usa o tipo de meio-termo chamado média, em vez da menor e mais informativa mediana... algo que já tratamos em capítulo anterior. Continua então supondo que a renda de uma familia esteja na razão direta de seu tamanho. Bem, eu tenho quatro filhos e gostaria que as coisas ocorressem daquela forma, mas não ocorrem. Famílias de quatro, de maneira alguma, tem comumente o dobro das posses das famílias de dois membros.

COMO GANHAR $ 22.500 POR ANO (BRUTO)

1. Adquira pelo menos 1 (uma) esposa e 13 filhos.
2. Calcule a renda per capita dos EUA (Resp.: $ 1.500 por ano, aproximadamente)
3. Multiplique por 15 (Resp.: 15 x $1.500 = $22.500)

105.gif (8553 bytes)

Com justiça para os estatísticos da Russel Sage, os quais, presume-se, estão inocentes, deve ser dito que primariamente estavam mais interessados em criar uma imagem de distribuição do que de recolhimento. O engraçado número sobre a renda familiar foi tão somente um subproduto. No entanto o erro que disseminou não foi reduzido por ser um sub-produto, e permanece um excelente exemplo de porquê não se pode ter muita fé em declarações não explicadas sobre a média.

Devido a um falso ar de precisão, que dará todas as garantias aparentes à mais desaforada estatistica, considerem as vírgulas decimais. Pergunte a cem pessoas quantas horas dormiram na noite passada, Conseguirá, digamos, um total de 7,831. Já de início, todo dado desse tipo está longe de ser preciso. A maioria das pessoas engana-se em quinze ou mais minutos, e não há segurança de que os erros mútuos equilibrar-se-ão. Todos nós conhecemos alguém que, por cinco minutos não dormidos, reclamara de uma terrível insônia pela metade da noite. Mas vá em frente, faça sua aritmética, anuncie que o povo dorme uma media de 7,831 horas por noite. Você dará a impressão de conhecer precisamente o que diz. Se você tivesse sido tolo a ponto de declarar somente que o pessoal dorme 7,8 (ou "quase 8") horas por noite, não teria havido nada sensacional nisto. Você teria dado a impressão do óbvio, uma pobre aproximação, não mais instrutiva do que a simples suposição de qualquer pessoa.

107.gif (19228 bytes)

Karl Marx não deixava de ter um ar de precisão no mesmo estilo. Ao enumerar a "proporção da mais-valia" numa tecelagem, iniciou com uma explêndida coleção de suposições, advinhações e números arredondados: "Supomos que a perda seja 6%... a matéria-prima... custa em números arredondados 342 libras. Os 10.000 fusos... custam, vamos supor, 1 libra por fuso... O desgaste colocamos em 10%... O aluguel do prédio supomos ser 300 libras... " Diz ele, "os dados acima, nos quais podemos confiar, me foram fornecidos por um tecelão de Manchester."

108.gif (31096 bytes)

Partindo dessas aproximações, Marx calcula que: "A percentagem de mais-valia é portanto 80/52 = 153 11/13 %". Para um dia de 10 horas isso lhe dá: trabalho necessário = 3 31/33 e mais-valia = 6 2/33."

Há um agradável sentimento de exatidão naqueles dois-trinta-e-três ávos de hora, mas é tudo blefe.

As percentagens oferecem um campo fértil para confusão. E, como a sempre-impressionante vírgula decimal, podem dar uma auréola de precisão ao inexato, A Revista Mensal do Trabalho, do Departamento do Trabalho dos Estados-Unidos, declarou certa vez que, dos oferecimentos de domésticas de meio-expediente, com pagamento da passagem, em Washington, durante um mês especificado, 4,9 por cento eram a $18 por semana. Essa percentagem, foi revelado, baseou-se em precisamente dois casos, havendo ao todo um total de quarenta e uma ofertas. Qualquer percentual baseado num pequeno número de casos é provavelmente enganoso. É mais informativo citar o próprio número em si. E quando a percentagem é levada além da virgula, você começa a percorrer a escala que leva do idiota ao fraudulento.

"Compre seu Presente de Natal agora e economize 100 por cento", anuncia uma propaganda, Isso soa como uma oferta digna do próprio Papai Noel, mas transforma-se numa mera confusão de base. A redução é somente cinquenta por cento. A economia é cem por cento do desconto ou do preço novo, mas não é o que o anunciante diz.

Do mesmo modo, quando o presidente de uma associação de floricultores disse, em entrevista para um jornal, que "as flores estão 100 por cento mais baratas do que há quatro meses", ele não quis dizer que "os floristas agora as distribuem gratuitamente", Mas foi o que disse. Na sua "História da Standard Oil Company". Ida M. Tarbell foi ainda mais longe. Disse ela que "os cortes de preços no sudoeste... alcançaram de 14 a 220 por cento". Isso seria fazer o vendedor pagar ao consumidor uma considerável soma de dinheiro para fornecer-lhe gasolina...

O Dispatch, de Columbus, declarou que certo produto manufaturado está sendo vendido com lucro de 3.800 por cento, baseando isto num custo de $1,75 e num preço de venda de $40. Ao calcular percentagem de lucro, você tem uma escolha de métodos (e você é obrigado a indicar qual está usando). Se baseado no custo, esse chega a um lucro de 2.185 por cento; se no preço de venda, 95,6 por cento. O Dispatch aparentemente usou um método próprio e, como frequentemente parece ocorrer, conseguiu um número exagerado para relatar. Até o The New York Times perdeu a "Batalha da Troca de Base" ao publicar uma noticia da "Associated Press", vinda de Indianapolis: "A depressão sofreu rude golpe aqui, hoje. Bombeiros, estucadores, carpinteiros, pintores e outros membros do Sindicato dos Construtores de Indianápolis receberam um aumento salarial de 5 por cento. Isso devolveu-lhes um quarto da redução salarial de 20 por cento que tiveram no último inverno."

110.gif (24922 bytes)

Soa razoável à primeira vista - mas a redução foi expressa numa base - salário que recebiam antes - enquanto que o aumento usa uma base menor, o nível de pagamento depois da redução.

111.gif (21283 bytes)

Você pode examinar este exemplo de desfiguração estatistica, supondo, para simplificar, que o salário original fosse $1 por hora. Reduza vinte por cento, e cairá para 80 centavos. Um aumento de cinco por cento nisso é 4 centavos, o que não é um quarto, mas sim um quinto do corte. Como muitos erros presumivelmente honestos, este, de algum modo, tornou-se, um exagero que fez uma notícia mais interessante.

Tudo isso explica porque, para equilibrar um corte de cinquenta por cento, você deve conseguir um aumento de cem por cento.

O Times também informou, certa vez, que, durante um ano financeiro, "a mala aérea perdida por incêndios foi 4.863 libras, ou uma percentagem de 0,00063". A noticia dizia que os aviòes haviam transportado 7.715.741 libras de correspondencia durante o ano. Uma companhia de seguros, baseando suas taxas daquele modo, poderia meter-se em boa sinuca. Calcule a perda e verificará que foi de 0,063 por cento, ou cem vezes mais do que o jornal havia declarado.

É a ilusão da troca de base que concorre para a malícia de somarem-se descontos. Quando um revendedor de ferragens oferece "50% e 20% de desconto do total," ele não quer dizer um desconto de setenta por cento. O desconto é sessenta por cento, desde que os vinte por cento sejam aplicados sobre a base menor, depois de tirados os cinquenta por cento. Grande quantidade de enganos e golpes baixos originam-se da adição de parcelas não-adicionáveis, mas que meramente parecem adicionáveis. As crianças, há gerações, têm usado uma forma dessa arma para provar que não vão à escola.

Você provavelmente se recorda. Começando com 365 dias para o ano, subtraia 122 para um terço do tempo que passa dormindo e 45 pelas três horas diárias gastas nas refeições. Dos restantes 198, tire 90 pelas férias de verão e 21 pelas férias de junho (ou julho). Os dias restantes não são suficientes nem para os sábados e domingos. Truque muito velho e óbvio para ser usado em coisas sérias, poderá você dizer. Mas a União dos Trabalhadores na Indústria Automobilística afirma, na sua revista mensal Ammnunition, que isto ainda é usado contra eles.

OBS:

No Brasil, trabalha-se em média 40 horas por semana.
Descontando 5 semanas de férias e feriados nacionais, temos:

(47 semanas/ano) x (40 horas/semana) = 1.880 horas de trabalho por ano, ou
1880/24 = 78 dias de trabalho por ano (a 24 horas por dia)

Usando agora o cálulo do autor, porém corretamente:

365 dias por ano

menos  30 dias de férias
menos  96 dias de sábados e domingos, fora férias ( 48 semanas x 2 fins-de-semana )
menos  06 dias de feriados, fora férias

233 dias de trabalho por empregado por ano

menos  155 dias para repouso e lazer (2/3 de 233 dias)

78 dias de trabalho por ano (a 24 horas por dia)

O largo horizonte azul da mentira também vem à tona em cada greve. Sempre que há uma greve, a Câmara de Comércio anuncia que está custando tantos milhões de dólares por dia. Conseguem eles tal número somando todos os carros que teriam sido produzidos se os grevistas houvessem trabalhado em tempo integral. Do mesmo modo somam as perdas dos fornecedores. Tudo é adicionado, incluindo-se passagens de ônibus dos empregados e a queda nas vendas dos comerciantes.

 113.gif (23196 bytes)

É igualmente estranha a idéia de que percentagens podem ser livremente somadas, como se fossem maçãs, o que tem sido usado contra os autores. Veja como soa convincente esta do The New York Times Book Review:

"O vácuo entre o crescente preço dos livros e o ganho dos autores, ao que parece, é devido a uma produção substancialmente maior e ao custo dos materiais. Só os gastos de planejamento e mão-de-obra atingiram 10 a 12 por cento mais que na última década, material mais 6 a 9 por cento, despesas de venda e anúcios atingiram mais de 10 por cento. Os aumentos combinados totalizam um mínimo do 33 por cento (para uma editora) e quase 40 por cento para algumas das editoras menores."

Na verdade, se cada item de custo da publicação deste livro atingiu cerca de dez por cento, o custo total deve ter atingido também mais ou menos essa proporção. A lógica que permite somar essas proporções de aumento poderia levar a todos os tipos de vôos de imaginação. Compre vinte artigos hoje e descubra que cada um subiu cinco por cento sobre o ano passado. Isto "soma" cem por cento. O custo de vida dobrou!...

Isto parece um pouco com a história do vendedor de beira de estrada que foi chamado a explicar como podia vender sanduiches de coelho tão baratos. "Bem", disse ele, "eu tenho que colocar também alguma carne de cavalo. Mas eu as misturo meio a meio: um cavalo, um coelho".

114.gif (33574 bytes)

Uma publicação sindical usou um desenho animado para combater uma outra variante de soma infundada. Mostrava o patrão somando uma hora normal de $1,50 a uma hora extra de $2,25, a uma hora de tempo duplo de $3 para uma média horária salarial de $2,25. Seria difícil encontrar um exemplo de média com menos significado.

Outro campo fértil para ser tapeado repousa na confusão entre percentagem e pontos de percentagem. Se seus lucros devem subir de três por cento do investimento num ano, para seis por cento no próximo, você pode fazê-lo parecer algo modesto, chamando de aumento de três pontos de percentagem. Com igual validade você pode descrevê-lo como aumento de cem por cento. Para o manejo desenfreado desse par confuso, observe particularmente os pesquisadores de opinião pública.

Percentis também são enganosos. Quando lhe dizem a posição do João em comparação com seus colegas em Álgebra ou em alguma aptidão, o número pode ser um percentil. Significa sua posição relativa em cada centena de estudantes. Numa turma de trezentos, por exemplo, os três primeiros estarão no percentil 99, os três próximos no 98, e assim por diante. O curioso sobre percentis é que um estudante classificado no percentil de grau 99 está, provavelmente, bem acima de um que esteja no 90, enquanto que aqueles dos percentis 40 e 60 podem ter quase o mesmo nivel. Isso advém do hábito que muitas características possuem de agruparem-se em torno de sua própria média, formando a curva "normal" em forma de sino, já mencionada num capitulo anterior.

Algumas vezes a batalha dos estatísticos se trava, e mesmo o observador menos sofisticado não pode deixar de ver um "dente de coelho". Os homens honestos marcam um tento quando estatisticularizadores são derrubados. O Conselho da Indústria denunciou algumas molecagens praticadas tanto pelas companhias de aço como por sindicatos. Para mostrar como os negócios haviam sido bons em 1948 (como evidência de que as companhias poderiam bem suportar um aumento de salários) o sindicato comparou a produtividade desse ano com a de 1939 - um ano de volume especialmente baixo. As companhias, para não serem passadas para trás no Grande Prêmio da Tapeação, insistiram em fazer suas comparações na base do dinheiro recebido pelo empregado, ao invés da média horária de ganhos. A razão disso era que tantos trabalhadores tinham estado trabalhando em tempo parcial no início do ano, que suas rendas tenderiam a mostrar crescimento, mesmo que o salário absolutamente não aumentasse.

A revista Time, notabilizada pela coerente excelência de seus gráficos, publicou um que é um divertido exemplo de como a Estatística pode tirar da cartola quase tudo o que se deseja. Encarada com uma escolha de métodos igualmente válidos, um favorecendo o ponto de vista do gerente e outro favorecendo o do operário, o Time simplesmenfe, usou ambas. O gráfico era, na verdade, dois gráficos superpostos. Usavam os mesmos dados. Um mostrava salários e lucros em bilhões de dólaress. Era evidente que tanto os salários como os lucros cresciam, e mais ou menos pela mesma quantidade. E era também evidente que os salários representavam talvez seis vezes mais dólares do que os lucros. A grande pressão inflacionária, parecia, originava-se dos salários.

A outra parte do duplo gráfico expressava as mudanças em percentuais de aumento. A linha do salário era aproximadamente horizontal. A linha do lucro disparava como um foguete. Lucros, dever-se-ia inferir, eram o principal responsável pela inflação. Você poderia escolher suas conclusões. Ou, talvez melhor, poderia facilmente ver que nenhum elemento poderia ser isolado como o culpado. Algumas vezes é uma vantagem substancial chamar simplesmente a atenção para o fato de um assunto em controvérsia não admitir uma solução rígida como se faz parecer.

117.gif (20224 bytes)

Números Índices são assuntos vitais para milhões de pessoas, agora que as taxas salariais estão frequentemente amarradas a eles. Talvez seja valioso notar o que pode ser feito para fazê-los dançar de acordo com a música desejada.

Tomando o exemplo mais simples possível, digamos que o leite custasse vinte centavos o quarto de litro e o pão cinco centavos a forma. Este ano o leite caiu para dez centavos e o pão subiu para dez centavos. Bem, que é que você gostaria de provar? Aumento do custo de vida ? Redução do custo de vida ? Ou nenhuma variação ? Considere o ano passado como período-base, fazendo os preços daquela época 100 por cento. Como o preço do leite desde então caiu a metade (50 por cento) e o preço do pão dobrou (200 por cento) e a média de 50 e 200 é 125, os preços aumentaram 25 por cento!

Tente de novo, tomando o ano corrente como periodo-base. O leite custava 200 por cento mais do que custa agora e o pão era vendido por 50 por cento menos. Média: 125 por cento de aumento. Os preços eram 25 por cento mais altos do que agora!

118.gif (14711 bytes)

Para provar que o nível do custo de vida absolutamente não varíou, simplesmente mudamos para a média geométrica e usamos qualquer um dos períodos como base. Isso é um pouco diferente da média aritmética, que temos usado, mas é um tipo de número perfeitamente legítimo e em alguns casos o mais útil e mais revelador. Para conseguir a média geométrica de três números, multiplique-os entre si e extraia a raiz cúbica. Para quatro itens, a raiz quarta; para dois, a raiz quadrada. E assim por diante.

118A.gif (32899 bytes)

Tome o ano passado como base e chame seu nível de preços 100. Na verdade, você multiplica, junto, 100 por cento para cada item e toma a raiz, que é 100. Para este ano, leite a 50 por cento do ano passado e o pão a 200 por cento, multiplique 50 por 200 para ter 10.000. A raiz quadrada, que é a média geométrica, é 100. Os preços não aumentaram nem cairam!

119.gif (32812 bytes)

O fato é que, apesar de sua base matemática, a estatística é muito mais uma arte que uma ciência. Grande quantidade de manipulação e atá distorções são possíveis dentro dos limites da decência. Frequentemente o estatistico deve escolher entre os métodos, um processo subjetivo, e encontrar aquele que usará para representar os fatos. Na prática comercial é possivel que ele não selecione um método desfavorável, como o redator de publicidade que chamou o produto de seu patrocinador de frágil e barato, quando poderia ter dito, "leve e de construção econômica."

120.gif (17882 bytes)

Até o homem no trabalho acadêmico pode ter um preconceito (talvez inconsciente) para favorecer um ponto a ser provado, um desejo a satisfazer, uma idéia a servir. Isso sugere que se dê à matéria estatística, aos fatos e números nos jornais e livros, revistas e anúncios, uma segunda revisão severa, antes de se aceitar qualquer deles. Algumas vezes uma cuidadosa observação porá a coisa em foco. Mas a recusa arbitrária dos métodos estatisticos também não faz sentido. Isso seria como se recusar a ler porque os autores algumas vezes preferem usar palavras para esconder os fatos e não para revelá-los.

Além do mais, um candidato politico na Flórida, havia algum tempo, conseguiu considerável votação acusando seu adversario de "praticar o celibato". Um exibidor de Nova York, do filme Quo Vadis, usou letras grandes para citar o New York Times, que chamava o filme de "pretenciosidade histórica." E os fabricantes dos "Lunáticos Cristais d'Água", um remédio evidentemente maluco, têm anunciado seu produto como proporcionador de "alívio rápido e efêmero".

121.gif (19795 bytes)