053.gif (10180 bytes)

MUITO BARULHO POR PRATICAMENTE NADA

Caso não se incomode, começaremos por lhe dar duas crianças: Pedro e Paula, que foram submetidas a testes de inteligência, como sucede com muitas crianças no decorrer de sua educação. Ora, o teste mental, de qualquer variedade, é um dos grandes fetiches de nossa era, de modo que você tera que discutir um pouco para chegar a descobrir os resultados dos testes; tal informação é tão esotérica, tão resguardada dos olhos profanos, que geralmente só é considerada segura nas mãos de psicólogos e autoridades educacionais, e pode ser que andem muito certos! De qualquer modo, suponhamos que você descubra que o QI (Quociente de Inteligência) de Pedro é 98 e o de Paula é 101. Suponhamos ainda que você saiba que o QI se baseia no número 100 como sendo a média, ou o "normal".

Ah! Paula é a mais brilhante dos dois! Além disso, está acima da média. Pedro está abaixo, mas deixemos isto, por ora.

Conclusões como estas são pura idiotice.

Só para aclarar o ambiente, vamos notar primeiro que, seja o que for que qualquer teste de inteligência venha a medir, tal coisa não será bem aquilo que usualmente consideramos inteligência. São deixados de fora pontos importantes como liderança e imaginação criativa. Não se leva em conta o julgamento social ou aptidões musicais ou artísticas, para não dizer de coisas da personalidade, como diligência e equilíbrio emocional. Por cima de tudo, os testes geralmente aplicados nas escolas são do tipo rápido-e-barato, que dependem um bocado da facilidade de leitura; brilhante ou não, o leitor de apreensão lenta não tem grandes chances de se sair bem neles.

054.gif (34822 bytes)

Digamos que reconheçamos tudo isso, e concordemos em considerar o QI simplesmente como uma medida de uma capacidade vagamente definida de lidar com abstrações enlatadas. E Pedro e Paula receberam o que se poderá considerar um dos melhores testes, o Stanford-Binet Revisto, que é administrado individualmente e não exige nenhuma capacidade excepcional de leitura.

Ora, o que um teste de QI pretende ser é meramente uma amostragem do intelecto. Como outro produto qualquer do método de amostragem, o QI é um número, com um erro estatístico que expressa a precisão ou fidedignidade de tal número.

Fazer as perguntas do teste parece um tanto com o que você poderia fazer para estimar a qualidade do milho num campo, andando por ele, e arrancando uma espiga aqui e outra lá, ao acaso. No momento em que tiver arrancado e examinado umas cem espigas, voce terá uma idéia razoável de todo o milharal. Sua informação será bastante exata para uso na comparação deste milharal com outro - caso ambos não sejam muíto parecidos. Se forem parecidos, você terá que examinar um número muito maior de espigas, e avaliá-las por um padrão de qualidade mais preciso que seus olhos.

A justeza com que sua amostra possa ser considerada como representativa de todo o milharal é uma medida que pode ser representada por números: o erro-provável e o erro-padrão.

Suponhamos que você tenha que medir o tamanho de muitos campos, andando ao longo das cercas. A primeira coisa que deve ser feita é verificar a justeza de seu sistema de medida, andando várias vezes uma distância medida de cem metros, para verificar quantos passos seus estão ali contidos. Você poderá déscobrir que, em média, haverá um erro de três metros. Isto é, você deixou de acertar a linha exata de cem metros por menos três metros, em metade de suas tentativas, e por mais três metros na outra metade.

Seu erro provável será então de três metros em cem, ou três por cento. Daqui por diante, cada cerca que for medida por seus passos, de cem em cem metros, deverá ter tal medição expressa como (100 metros mais ou menos 3 metros). A maioria dos estatísticos prefere agora usar outro método de medição, diferente mas comparável, chamado "método do desvio-padrão". Tal método considera cerca de dois terços dos casos, em lugar de exatamente a metade, e é considerado mais jeitoso, do ponto de vista matemático. Para nossa finalidade, poderemos ficar no método do erro provável, que é o utilizado nos testes Stanford-Binet.

056.gif (11530 bytes)

Como sucede nos nossos passos hipotéticos, descobriu-se que o erro provável do QI Stanford-Binet e de três por cento. Isto nada tem a ver com a qualidade básica do teste, mas apenas relaciona-se com o grau de justeza ou acuracidade com que ele "sempre" mede o que quer que seja medido. Assim, o QI indicado para Pedro poderá ser mais completamente expresso como 98 (+ ou -) 3 e o de Paula como 101 (+ ou -) 3.

Isto revela que há uma chance 'igual' para que o QI de Pedro 'caia' entre 95 e 101; ou que esteja acima ou abaixo de tais números. Do mesmo modo, Paula não tem uma chance melhor do que 50-50 de ficar na faixa de 98 a 104. Dai você depreenderá rapidamente que há uma chance em quatro de que o QI de Pedro esteja realmente acima de 101 e uma chance semelhante de que o de Paula esteja abaixo de 98. Então Pedro não é inferior, mas superior, e por uma margem de pouco mais de três pontos!

O que tudo isso revela é que a única maneira de pensar-se em QIs, e muitos outros resultados de amostragens, deve ser em termos de faixas. "Normal" não é 100, mas, digamos, a faixa entre 90 e 110, e poderá haver alguma lógica em comparar-se uma criança nesta faixa com outra numa faixa superior ou inferior. Mas comparações entre números de pouca diferença não fazem sentido. Deve-se ter sempre em mente esse "mais -ou-menos", especialmente quando não é mencionado.

A ignorância de tais erros, que se acham implicitos em todos os estudos de amostragem, tem conduzido a certos procedimentos notavelmente tolos. Há editores de revistas para os quais as pesquisas de leitura são evangelhos, principalmente porque tais editores não entendem patavina das pesquisas. Com um relatório indicando 40% de leitura masculina de um determinado artigo, e 35% de um outro, passam a exigir mais artigos para o primeiro.

A diferença entre 35% e 40% de leitura pode ser importante para uma revista, mas tal diferença, num levantamento, pode não ser real. Os altos custos sempre reduzem as amostragens de leitura a umas poucas centenas de pessoas, especialmente depois de eliminados os que nunca lêem aquela determinada revista. Para uma revista primariamente feminina, o número de homens na amostra pode vir a ser pequeno demais. À medida que estes forem divididos entre os que dizem que "leram tudo", que "leram quase tudo", que "leram parte" ou que "não leram" o tal artigo, a conclusão dos 35% poderá ter sido tirada de um simples punhado. O erro provável, oculto por trás do impressionante número 35%, poderá ser de tal magnitude que o editor poderá vir a dar-se muito mal.

Às vezes, faz-se muito barulho sobre uma diferença matematicamente real e demonstrável, mas tão pequena que não tem a miníma importância. Isto apesar do velho e ótimo adágio que diz que "uma diferença só é diferença se fizer diferença." Um caso a calhar foi a barulheira eficiente e lucrativamente levantada a respeito de praticamente nada, pelo pessoal dos cigarros 'Old Gold'.

Começou tudo inocentemente, com o editor do Reader's Digest, que fuma seus cigarrinhos, mas mantém uma atitude combativamente contrária ao fumo. Sua revista saiu em campo e armou uma bateria de gente de laboratório analizando a fumaça de várias marcas de cigarros. A revista publicou os resultados, dando o conteúdo de nicotina e outras porcarias nas fumaças, por marcas. A conclusão declarada pela revista e apresentada em números detalhados era a de que todas as marcas eram virtualmente idênticas, e que não faria diferença a marca que você fumasse.

Ora, isto poderá lhe parecer um golpe duro contra os fabricantes de cigarros e contra os sujeitos que ficam pensando em novos ângulos para seus fraseados, nas agências de publicidade. Parecia que todas as afirmativas categóricas sobre suavidades à garganta e doçuras para com a "zona-T" eram mandadas para o inferno.

Entretanto, alguém verificou uma coisa: nas listas de quantidades quase idênticas de venenos, uma das marcas inevitavelmente teria de ficar por último, e essa era Old Gold. Lá saíram telegramas, e anúncios enormes apareceram imediatamente nos jornais, nos maiores tipos que se poderia arranjar. As manchetes e os textos simplesmente diziam que "de todos os cigarros testados por esta grande revista nacional, Old Gold apresentava a menor quantidade desses elementos indesejáveis em sua fumaça". Foram excluidos todos os números, e qualquer sugestão de que a diferença fosse, na realidade, ínfima. Por fim, o pessoal da Old Gold foi compelido judicialmente a cessar com campanha tão enganosa. Isto não fez a menor diferença; o beneficio já tinha sido extraído da idéia. Como o New Yorker diz: "Em qualquer situação haverá sempre um anunciante!"

059.gif (19455 bytes)