Os truques da estatística (II) – 2ª parte. Por José Manuel Lechado

Seleção e tradução de Francisco Tavares

truques estatística

 

Os truques da estatística (II) – 2ª parte

Por José Manuel Lechado, Jornalista e Escritor

Público.es, 16 de maio de 2015

http://blogs.publico.es/econonuestra/2015/05/16/5617/

 

4. Falácias e Paradoxos

Os truques das estatísticas incluem diversas falácias diversas e um ou outro paradoxo. A mais conhecida é a chamada «falácia do resíduo». Muitas amostras estatísticas contêm uma percentagem de dados que não encaixam ou não têm explicação. Este «resíduo» estatístico costuma ser pequeno e normalmente é desprezado.

O problema é que, às vezes, utiliza-se o resíduo como evidência de algo sem que haja uma base real para semelhante conclusão. Por isso é uma falácia. Um caso muito conhecido é o da pseudociência chamada ufologia [ovniologia], a qual «argumenta» que se mais ou menos uns 5% das aparições ovnis não têm explicação, isso é uma «prova» de que existem os ovnis. A verdade é que, posto assim, é irrefutável: um ovni não é outra coisa senão um «objeto voador não identificado». O globo de plástico que se escapa das mãos de uma criança pode ser um ovni perfeito. A coisa muda se se pretende, já agora, que um ovni seja uma nave interplanetária de origem extraterrestre.

Outro exemplo mais sério de falácia do resíduo é o seguinte: o departamento de saúde decide aplicar uma vacina contra a gripe do pato que, segundo o fabricante, demostrou ter uma efectividade de 98%. Aplica-se a vacina a toda a população (de pessoas, não dos patos), com o que se espera que a epidemia fique controlada salvo para esses pequenos 2% residuais, quantidade que o governo considera satisfatória. À partida cabe perguntar se esses 2% podem ser desprezados assim com tanta tranquilidade: se o país de que falamos tiver 50 milhões de habitantes, 2% representa 1 milhão de pessoas. Numa decisão governamental deste tipo deveriam pesar mais fatores do que uma simples percentagem: haveria que avaliar os números absolutos, a gravidade da doença e o custo da vacina.

Antes de as sondas soviéticas da série Venera terem chegado a Vénus e descoberto a realidade desagradável desse mundo, os observadores terrestres faziam todo o tipo de elucubrações fantásticas. O astrónomo Carl Sagan descrevia o fenómeno com muita graça num episódio de Cosmos. Era mais ou menos assim: «Em Vénus existem nuvens. Se existem nuvens, tem que chover. Se chove, haverá uma copiosa vegetação. Se existem selvas, haverá animais. E se existem animais, sendo um mundo em estado primitivo, haverá inclusive dinossauros». Sagan resumia esta série ilógica de raciocínios desta maneira: «Não vejo nada, logo existem dinossauros». A falácia do resíduo parece-se muito com esta forma de «raciocinar».

Outra falácia típica tem que ver com a probabilidade condicionada, que existe em muitas análises estatísticas. Resumindo, a probabilidade condicionada implica que um acontecimento determinado somente se produzirá se antes sucede outro acontecimento diferente. A probabilidade total resulta da multiplicação das probabilidades individuais de ambos. Desta maneira podem-se encadear acontecimentos desde dois até ao infinito. Mas existe um tributo a pagar: em geral, cada acontecimento acrescentado diminui as probabilidade de que ocorra o conjunto de todos (veja-se a esse respeito o meu artigo «La ecuación V», onde se encadeiam várias probabilidades condicionadas no momento de prever se um partido cumprirá ou não as suas promessas eleitorais no caso de vencer).

Isto são matemáticas de ensino secundário, mas a sua deficiente aplicação na interpretação de dados estatísticos pode ter consequências na produção económica, na gestão governamental ou na perceção que o público tem sobre um facto concreto. A falácia da probabilidade condicionada costuma ser explicada com um exemplo clássico: suponhamos uma enfermidade grave que sofre, em dado momento, 1% da população. Não apresenta sintomas senão demasiado tarde, mas por sorte dispõe-se de um exame para detectá-la precocemente com uma fiabilidade de 99%. É assim tão segura como parece? Imaginemos um país com 100.000 habitantes e que todos se submetem a esse exame. Os resultados são os seguintes: para começar há 1.000 pessoas que de facto padecem da doença, mas só acusam positivo 990 (haverá 10 falsos negativos de acordo a fiabilidade prevista). Por outro lado, das 99.000 personas restantes, que estão sãs, dão falso positivo 990. O número total de análises positivas é de 1.980 pessoas, metade das quais (990) não estão realmente doentes. A probabilidade condicionada radica na combinação de dois fatores: a exatidão do exame e o facto de estar ou não doente. neste caso os números finais indicam-nos que em caso de dar positivo apoia-nos uma probabilidade muito razoável de estarem sãos (50%). Deveríamos preocupar-nos o suficiente e pedir uma nova comprovação. Todavia, quase ninguém faz este tipo de cálculos: se nos submetemos a uma prova com uma fiabilidade tão elevada e dá positivo, é quase certo que ficaremos a tremer de medo e até que oiçamos bater sobre as nossas cabeças as negras asas da morte. Por sinal haverá também uma percentagem pequena, mas não desprezível, de doentes que julgarão estar sãos. Os casos de probabilidade estatística condicionada com interpretação errónea são abundantes e dão-se em todo o tipo de situações. Imaginem as consequências se a prova que acabamos de descrever se prescreve para uma doença com nome e apelido. Por exemplo, a sida, com toda a sua carga de terror e estigmatização social.

O que nos leva a outro tipo de falácia estatística: a da opinião. São habituais as estatísticas baseadas em inquéritos periódicos sobre temas o mais diversos. Em Espanha existem as chamadas «demoscopias», que interrogam a amostras consideráveis de população, uma ou várias vezes ao ano, sobre questões variadas. Um dos resultados mais populares das demoscopias são essas listas em que aparecem as preocupações das pessoas ordenadas de acordo com o maior ou menor grau de inquietude que provocam. Pois bem, estas classificações não têm validade para determinar a magnitude de nenhum problema, ainda que se utilizem desonestamente para isso: somente avaliam o estado de ânimo da sociedade ou até que ponto a propaganda influi nas opiniões das pessoas comuns.

Em geral a opinião pública maioritária é condicionada pelas noticias mais recentes, impactantes ou repetidas. Isto influi nos inquéritos: se se produziu um acidente aéreo poucos dias antes de realizar a recolha de dados é possível que a segurança das aeronaves figure como uma das inquietudes principais. Do mesmo modo, quando os media deixam de falar de um tema, este desaparece quase por completo das conversas de taberna e também das respostas neste tipo de estudos. Na realidade parece que quando o governo e os seus meios afins deixam de moer um assunto, não é apenas a preocupação pública que se evapora: atrevo-me a dizer que em muitos casos o próprio problema desaparece.

Um exemplo notável disto é a avaliação do terrorismo nos inquéritos de opinião espanhóis. Em termos absolutos (custo económico, número total de vítimas, possibilidade real de alcançar os seus objetivos políticos, etc.), inclusive nos piores tempos da violência política (que compreende um extenso período e muitos nomes: Eta, Guerrilleros de Cristo Rey, Triple A, Grapo, Terra Lliure, Batallón Vasco Español, Gal, Al-Qaida e outros grupos) o terrorismo em Espanha nunca deixou de ser um problema de ordem pública secundário e em geral muito controlado. Não obstante, sempre conseguiu ter um enorme reflexo nos meios de imprensa devido à sua natureza impactante e emotiva. Isto repercutiu-se por sua vez na opinião pública ao ponto de que em algumas Demoscopias o terrorismo chegou a aparecer como o mais grave dos problemas nacionais. Apesar desta perceção do fenómeno, é um facto constatável que esta forma de criminalidade afetou de maneira direta a uma percentagem muito pequena da população. Não é que a violência política não seja um problema, mas cabe preguntar se o seu reflexo nos inquéritos de opinião e na imprensa não é exagerado e serviu (serve) para justificar políticas de controlo social e leis cada vez mais repressivas que afetam não tanto aos escassos terroristas mas à maioria dos cidadãos (também se alegou, diga-se de passagem, que o excessivo protagonismo dos atentados nas notícias serviu os fins propagandísticos das organizações armadas, ainda que isso seja outra história).

Quando a manipulação neste sentido a pratica não Espanha, mas antes um país importante, comprova-se que a falácia de opinião pode ter consequências muito graves. Recordemos que, sob o pretexto do terrorismo, o governo dos Estados Unidos justificou, ao longo da primeira década do século XXI, várias invasões de países soberanos. Mas não só isso: também decretou, com o entusiasmo dos seus «federados» (em especial os estados da muito submissa União Europeia) leis transnacionais que põem em perigo as liberdades cidadãs, os direitos humanos a paz.

A falácia de opinião é além disso paradoxal porque os pontos de vista pessoais não constituem parâmetros objetivos e, portanto, não servem para extrair conclusões científicas válidas. Assim pois, um inquérito de opinião não pode ser considerado como uma verdadeira estatística, ainda que utilize procedimentos deste ramo da ciência. Continuando com o nosso exemplo, inclusive hoje em dia, quando em Espanha o terrorismo ficou reduzido a quase nada, todavia persiste a sua sombra e dá-se o caso de pessoas que deixam de viajar a este ou àquele país por medo de sofrer um atentado (postura que se dá também noutras nações). Se estes cidadãos analizassem com propriedade a informação útil, talvez anulassem de todo o modo a sua viagem, mas seria por outros motivos: talvez a muito mais elevada probabilidade de morrer de indigestão, trombose, disenteria, malária, afogamento, acidente de tráfico, sobredose ou mordeduras de serpente, que são causas muito mais prováveis de perder a vida durante uma viagem.

Para tirarmos o mal sabor de boca que deixa a violência terminaremos este ponto com curiosidade conhecida como o «paradoxo de Condorcet», por ser o matemático francês Nicolás de Condorcet o primeiro a descrevê-lo, no século XVIII. Chama-se também «paradoxo da votação», porque se bem que foi descrito pela primeira vez em relação aos jogos de azar, aplica-se com frequência em contextos eleitorais para demonstrar que as decisões coletivas (os resultados de uns comícios) tendem a ser cíclicas, ainda que as individuais (o voto pessoal) não o sejam. Entender-se-á melhor com um exemplo não político, mas antes comercial, mas a estrutura  os resultados são extrapoláveis para outras situações:

Realizou-se um inquérito sobre três detergentes (Action, Bioful y Costra) com os seguintes resultados:

-Uns 33,3% ordena-os assim de melhor para pior: Bioful, Costra, Action.
-Outros 33,3% opta por esta ordenação: Costra, Action y Bioful.
-Os 33,3% restantes escolhe assim: Action, Bioful y Costra.

Qual é o melhor detergente (ou o pior) segundo o inquérito? Tome algum tempo antes de responder e não faça o que faz o proprietário de Bioful, que se apressa a dizer que o melhor detergente é o seu (porque toma a iniciativa, suponhamos). No entanto, o dono de Action reage como um raio e desmente a interpretação dos dados: no total uns 66,6% dos inquiridos crê que Action é melhor Bioful, logo o seu detergente é o ganhador. O senhor Costra, que estava de férias, ao regressar toma conhecimento da notícia e declara que o seu produto é o melhor, pois uns 66,6% dos inquiridos considera-o superior a Action. Como já imaginará o leitor, não tardará em vir à ribalta de novo o amo de Bioful asegurando que o seu detergente é o favorito de dois terços das pessoas, por cima de Costra. Quem ganhou? Ninguém. Ou todos. Este é um caso muito simples do paradoxo de Condorcet, mas pode dar-se em variantes muito mais complexas, com mais participantes e datos mais arrevesados, em eleições, apostas, publicidade… O paradoxo em si não é uma falácia, mas sim é o uso que dele fazem os senhores Action, Bioful y Costra.

* * * * *

Existem muitas outras armadilhas e truques que se podem fazer partindo de dados estatísticos. Quisemos mostrar aqui algumas das mais notáveis para divertimento e aviso dos leitores. Às pessoas interessadas em aprofundar o assunto recomendamos o libro El hombre anumérico (Innumeracy: Mathematical Illiteracy and Its Consequences) do matemático estado-unidense John Allen Paulos —magnífica e muito divertida obra de divulgação que inspirou este artigo e alguns dos seus exemplos— cuja leitura não requer conhecimentos matemáticos especiais.

A estatística é uma ferramenta científica não apenas útil, senão maravilhosa e imprescindível. A natureza profunda da realidade só se pode entender em termos estatísticos, como muito bem sabem os especialistas em mecânica quântica. A Estatística, com maiúsculas, pode ser a arma fundamental para combater epidemias, desigualdades sociais ou a deterioração do meio ambiente planetário. No entanto, nas mãos de pessoas sem escrúpulos (e existem muitos) a interpretação de dados estatísticos converte-se num instrumento de manipulação e engano. A conclusão, se existe alguma, não é nova: fie-se da Estatística, mas não da propaganda. Não engula a informação sem antes parar para pensar um pouco, e quando o sobrecarreguem com uma sopa de dados, pergunte-se a si mesmo se não o estarão a gozar. Segundo uma estatística, em 84% das ocasiões será assim.

 

Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s

%d bloggers like this: