Os truques das estatísticas (I) – 1ª parte. Por José Manuel Lechado

Seleção e tradução de Francisco Tavares

truques estatística

Os truques das estatísticas (I) – 1ª parte

Por José Manuel Lechado, jornalista e escritor

In Publico.es em 16Abr2015

http://blogs.publico.es/econonuestra/2015/04/16/las-triquinuelas-de-las-estadisticas-i/

A estatística não é uma ciência: é um ramo da Matemática que surgiu na Alemanha em meados do século XVIII. Desde então não parou de crescer, as suas ferramentas multiplicaram-se e o seu uso estendeu-se a todo o tipo de campos, desde a dietética à física das partículas. E não é para menos, porque se trata de uma ferramenta muito potente que, entre outras coisas, serve para fazer modelos e previsões muito fiáveis partindo de bases probabilísticas e dados nem sempre completos. Uma capacidade que atraiu a atenção dos poderosos, e o seu próprio nome já o indica: a estatística (nome alcunhado pelo alemão Gottfried Achenwall em 1749) nasceu como um procedimento contabilístico para aumentar o controlo exercido pelo Estado.

Os poderosos são como o rei Midas, mas ao contrário: tudo o que tocam apodrece. Nas mãos de políticos profissionais, empresários, banqueiros ou militares, inclusive um ramo do conhecimento tão útil como este enche-se de ratoeiras quando se usa no jogo obscuro da dominação. Longe estava Achenwall de imaginar que o seu «invento», ao fim de mais de dois séculos e meio, serviria para manipular a opinião pública a tal extremo que hoje não é concebível uma campanha política, económica ou publicitária sem um cortejo de estatísticas destinado a convencer os cidadãos de que tudo vai bem, de que devem votar em tal ou tal partido, de que «necessitam» comprar isto ou aquilo. O que seja.

Pretender que os ambiciosos não façam batota é admitir o que não irá acontecer. Não obstante, o leitor poderá defender-se melhor destes enganos se conhecer os truques que se podem fazer com as estatísticas. Alguns são grosseiros, outros engenhosos e uns poucos, obras mestras. Embora as fronteiras não sejam sempre claras, podemos vê-los em quatro grupos: fraudes, abordagem não isenta, defeitos de interpretação e mentiras. Esperamos que a descrição destes truques – empregados diariamente pelos poderes públicos e privados para deformar a realidade, alterar a informação e enganar os cidadãos – resulte para o leitor não só útil, como divertido.

  1. FRAUDES

Quase toda a gente conhece a piada do frango: numa população de duas pessoas, uma come o frango e a outra não come nada. A estatística, no entanto, assegura que na população lhe toca meio frango por pessoa. Esta é uma fraude estatística clássica, mas há muitos mais, porque podem fazer-se estudos sobre quase qualquer assunto ao mesmo tempo que o engenho humano para fazer o mal é imenso.

Produzir uma estatística exige reunir dados, ordená-los de acordo com algum critério e, feito isso, interpretá-los para extrair conclusões. Em terrenos como a política ou a economia uma forma habitual de recolher dados consiste em realizar um inquérito. Esta base é o que se denomina de «amostra», ou seja, um grupo reduzido de uma «população». É dado por adquirido que a informação extraída da amostra é representativa do total da população, ainda que com uma margem de erro que varia de acordo com o tamanho relativo da amostra (quanto mais pequena seja, maior será aquela margem). E aqui é onde começam as armadilhas.

Um procedimento grosseiro consiste em escolher uma amostra demasiado pequena e mentir sobre a margem de erro (ou omiti-lo nas conclusões). Digamos, por exemplo, que 90 por cento dos meus partidários afirmam que eu sou o líder de que a Espanha necessita. É reconfortante, e agradeço o seu apoio, mas como inquérito não vale muito se eu tiver somente quatro apoiantes.

Antes de continuar é justo recordar que os erros podem não ser intencionais, e isto tanto na seleção da amostra como na determinação da margem de erro. Por outro lado, podem influir fatores aleatórios e, às vezes, incontroláveis: se o inquiridor for preguiçoso pode ser que não lhe apeteça subir aos andares mais elevados dos edifícios sem ascensor; e se decide visitar as pessoas, questionário na mão, na hora do descanso, talvez os pontos com «Não responde» sejam mais que o normal. Estes são problemas metodológicos que, sem serem fraude, alterarão os resultados.

A coisa deixa de ser inocente quando se falseia deliberadamente. Não tem maior mistério: os dados são elaborados à medida das conclusões desejadas, sem se fazer inquérito algum. Apesar de ser fácil descobrir um embuste como este, acontecem de vez em quando: o falsificador conta com a passividade ou a preguiça do público à hora de investigar a origem e a veracidade das conclusões apresentadas.

Uma fraude de aparência inocente radica no anonimato dos inquiridos. Recordemos que uma estatística baseada em inquéritos não pode ser anónima: cada pessoa que responda deve ser identificada para que a informação possa ser verificada de forma independente. Mas há mais: inclusive inquéritos reais, como os que aparecem frequentemente em revistas de papel ou digitais, carecem de validade se os inquiridos não introduzem a sua ligação ou filiação, porque o anonimato incentiva muitos a responderem de forma falsa, «imaginativa» ou pouco rigorosa. Não faz falta insistir no valor de uma estatística que parta de tais premissas. Mais ainda se, por cima, uma mesma pessoa tem a possibilidade de responder várias vezes ao mesmo questionário (coisa corrente na Internet). Vejamos um exemplo: uma revista oferece um questionário aos seus leitores para conhecer a sua opinião sobre a publicação. As conclusões são apresentadas sob grandes títulos do género: «Êxito esmagador. Noventa e cinco por cento dos inquiridos declara que a nossa revista é a melhor do quiosque». Sem dúvida assim é, uma vez que apenas opinaram as pessoas que já compravam a revista (sinal de que gostam dela). Mas falta a opinião dos que não a compram (e a dos leitores que não se incomodaram a responder).

A coisa piora quando se ocultam dados. Isto não implica que a estatística minta, mas desde logo não diz toda a verdade, pelo que as conclusões serão fraudulentas. Começa-se por selecionar os dados que apoiam a hipótese desejada e esquece-se o resto. Por exemplo, numa estatística (séria) sobre desemprego, descobre-se uma recuperação da atividade laboral. É uma boa notícia! O trabalho de campo, porém, deu outros dados: que os novos trabalhadores cobram metade dos antigos ou que a duração dos contratos se reduziu, em média, para a quarta parte do tempo. Os promotores da estatística (talvez o governo de turno) anunciarão em alto e bom som a redução do desemprego e não falarão sobre nenhum outro tema escabroso, como a perda de poder aquisitivo ou de horas de trabalho.

Outra possibilidade é a interpretação astuta de dados não conclusivos. Um estudo pode demonstrar que a principal causa de morte no mundo são as doenças cardiovasculares. É um facto certo e inegável. Porém, isto, por si mesmo, não indica nada. É possível que exista outra informação associada, como a de que a maior parte das pessoas que morrem por uma destas doenças tenha mais de setenta anos. No fim de contas, quando alguém é idoso morrerá de alguma coisa. Nesse mesmo estudo observa-se que as mortes em acidentes de tráfego, ainda que abundantes, são em menor número. Porém, a maioria das pessoas que morre num acidente deste tipo são bem mais jovens. Isto envolve fatores que não foram tidos em conta (talvez porque o estudo é financiado por uma conhecida marca de medicamentos contra o enfarte): que as pessoas morram jovens é associado a uma perda de anos de vida que, em termos humanos e económicos, é mais grave para o comum dos mortais (não para os que pagaram o estudo).

Para fechar o ponto sobre fraudes vejamos um truque muito habitual na apresentação das estatísticas: a manipulação gráfica. Os dados de uma estatística são fornecidos frequentemente em forma de diagramas lineares ou circulares (de «queijinhos»), quadros, histogramas, cartogramas, dispersogramas, pictogramas. É uma apresentação rápida e, com frequência, muito atrativa. Alguns procedimentos são bastante imaginativos mas também são fáceis de manipular. Os exemplos são inumeráveis, assim que veremos aqui o mais corrente: a mudança de escala num diagrama linear cartesiano:

truques estatística I 1

 

 

 

 

truques estatística I 2

 

Os dois gráficos ilustram a mesma realidade: o crescimento económico de um país no último ano. E os dois foram feitos com base nos mesmos dados, proporcionados por uma fonte que consideraremos neutral. Porém, um dos gráficos parece mostrar uma subida lenta, quase uma estagnação. Como pode ser? O recurso básico a uma simples mudança de escala, mas existem outros detalhes. Um apresenta o tempo em quadrimestres, o outro em meses. Um, além disso, apresenta a linha em vermelho «perigo» e o outro em verde «otimista». Um dos gráficos é o oficial do governo; o outro foi feito pela oposição. Qual é qual?

Em geral as representações gráficas da estatística podem ser maquilhadas de mil maneiras. Às vezes com procedimentos típicos da publicidade: os resultados favoráveis costumam ser disponibilizados com muito colorido e um formato «bonito». Mas se se quer apresentar alguma coisa «aborrecida», a aparência do desenho será sonsa e triste…. Não é exatamente uma fraude, mas tenta-se influenciar o ânimo do observador com truques alheios à informação em si mesma.

(continua)

Leave a Reply