Às margens da margem: Afinal, quem está a frente na corrida presidencial?

foto-corrida-cavalo-01Eu estava ansioso para ver o resultado dos levantamentos realizados
pelo Ibope e Datafolha divulgados nesta semana. A notícia veio meio
confusa, como quase sempre, os apresentadores tentando explicar o que
o intervalo de 95% de confiança significa etc, mas a parte mais
importante anunciada veio mais ou memos assim:
"Ibope/Datafolha divulgou uma nova pesquisa sobre a corrida
presidencial. O levantamento foi encomendado por [...]. Marina está
agora empatada (no limite da margem de erro) com a candidata Dilma
Rousseff do PT. [...] Vamos aos resultados."


A rede Globo reportou, e depois os jornais impressos a seguiram
dizendo que Dilma e Marina estão tecnicamente empatadas já que a
primeira está a frente da segunda por 4 pontos numa pesquisa, e por
apenas 1 ponto na outra. A margem de erro das pesquisas é de 2%. Para
lembrar rapidamente de onde vem os 2%, esse valor é baseado na teoria
que que: (1) os resultados estatísticos são confiáveis se eles tiverem
ao memos 95% de certeza de serem precisos. Ou seja, se a mesma
pesquisa fosse repetida, seus resultados estariam próximos dos valores
encontrados e dentro da margem de erro em pelo menos 19 vezes de 20.
E (2) qualquer percentagem maior que a margem de erro é menor do que
95% de certeza.

Há pelo menos três problemas com isso. O primeiro, é que "95%" não é
um tipo de número mágico--ou ponto de corte divino. Em segundo, a
ideia de que a margem de erro representa 95% de certeza também está
equivocada. Por fim, a margem de erro de uma pesquisa representa o
intervalo de confiança de 95% para a intenção de votos declaradas à
cada candidato, e não para a diferença entre eles. Este é o ponto mais
interessante que quero explorar.
O que me interessa é a probabilidade de que a diferença encontrada
pelos institutos é maior do que zero. Em outras palavras, em saber se
uma candidata está a frente da outra, e qual a probabilidade disso ser
verdade. Isso é importante porque ajuda o eleitor a tomar decisões
mais estratégicas sobre o destino do seu voto.
Ao invés de dizer que um resultado dentro da margem de erro é um
"empate", o que é estatisticamente incorreto, e também muito
improvável do ponto de vista político dado o universo de eleitores no
país, seria muito mais informativo (do ponto de vista da demanda) se a
mídia e os institutos de pesquisa também informassem a probabilidade
de uma candidata estar realmente a frente, dada a diferença entre
elas. Em primeiro lugar, a probabilidade não tem um ponto de corte,
mas é contínua (entre 0 e 1): quanto maior a diferença, mais provável
é de que alguém esteja a frente; logo, o resultado de uma pesquisa não
pode ser relegado à mera casuística. Assim, eu fiz o dever de casa
construindo a seguinte quadro/gráfico que mostra exatamente isso.
prob

 

 

 
Voltando ao que me motivou escrever esse texto, eu queria saber qual é
probabilidade de que Dilma esteja genuinamente a frente de Marina?
Como a margem de erro das pesquisas divulgadas pelo Ibope e Datafolha
é de 2%, precisamos olhar na primeira linha no topo do quadro. No
Datafolha, a diferença de Dilma é de 1% (35 - 34 de Marina), assim,
vamos olhar na coluna (1%), e podemos encontrar que existe uma
probabilidade de 69% de que ela realmente esteja a frente de Marina.
Já no levantamento do Ibope, a diferença entre elas é de 4% (37- 33),
o que se traduz em uma probabilidade ainda maior: 98% de que Dilma
esteja a frente. Portanto, a probabilidade de que a vantagem de Dilma
sobre Marina nos dois levantamentos não seja fruto de erro amostral é
saliente.

Verdadeiramente, há muitos outros fatores que apenas erros amostrais
que podem afetar uma pesquisa de opinião. Experimentos realizados com
surveys apresentam evidências conclusivas de que o tipo de questão, a
ordem, e até o tempo dos verbos usados nas questões podem afetar
significativamente os resultados. Além disso, na maioria das vezes as
empresas de pesquisa acabam coletando a opinião de apenas uma parcela
da população, e o problema nem sempre é das empresas, mas está
relacionado também aos traços de personalidade/genética de grupos de
eleitores. Por fim, a quantidade de pessoas entrevistadas é
importante, mas muito mais importante é a quantidade e o intervalo de
levantamentos feitos. Com levantamentos mais frequentes, não só os
eleitores teriam informação atualizadas sobre a disputa, mas os
próprios institutos também aprenderiam sobre os eleitores e como estes
decidem. A medida em que as eleições se tornam mais competitivas
(aquelas em que a diferença é menor do que a margem de erro), a
quantidade e a qualidade da informação trazidas pelas pesquisas entram
no cálculo dos eleitores, portanto, importantes para a decisão em
democracias.
Do ponto de vista metodológico, estar a frente é estar a frente. Do
ponto de vista político, é sempre melhor liderar do que ser liderado,
então, a provocação que eu faço é para os jornalistas e apresentadores
deixarem de mencionar esse negócio místico de "empate técnico"
estatístico e passar a informar o que é mais importante: qual é a
probabilidade de um candidato vencer a eleição dada a informação que
temos hoje. Eu fiz no quadro acima todo o trabalho pesado, e só me
tomou alguns minutos.

Abs e até a próxima!

Daniel Marcelino
Para saber mais, consulte:

Groves, R. M., Fowler Jr, F. J., Couper, M. P., Lepkowski, J. M.,
Singer, E., & Tourangeau, R. (2013). Survey methodology. John Wiley &
Sons.

Thompson, S. K. (2012). Sampling (3rd ed.). Hoboken: Wiley.


Fatal error: Uncaught Exception: 12: REST API is deprecated for versions v2.1 and higher (12) thrown in /home/storage/4/6f/c7/pesquisamaconica/public_html/metodologiapolitica/wp-content/plugins/seo-facebook-comments/facebook/base_facebook.php on line 1273