Revista VEJA

Eleições e Big Data

Institutos de pesquisas não conseguirão mais prever com precisão os grandes pleitos eleitorais sem recorrer à análise de dados que circulam na web

Por Maurício Moura *
Atualizado em 4 jun 2024, 17h51 - Publicado em 1 dez 2017, 06h00

Donald Trump - apesar de voto contrário de democratas, presidente tem mais uma vitória (Tom Pennington/Getty Images)

“A vida imita o xadrez.” Esse é o título do livro de um dos mais famosos jogadores de xadrez da nossa época, o russo Garry Kasparov. Alguns o consideram o maior enxadrista de todos os tempos. Para quem não é familiarizado com o jogo, um tabuleiro clássico de xadrez é um quadrado dividido em 64 quadrados menores, no qual se movem 32 peças — dezesseis brancas e dezesseis pretas. Existem 170 000 000 000 000 000 000 000 000 (170 setilhões!) de maneiras de fazer os dez primeiros movimentos numa partida de xadrez. Depois de apenas quatro lances, o número de combinações possíveis do jogo chega a 315 bilhões. Um mestre do xadrez como Kasparov organiza rapidamente um volume gigantesco de informações.

Em 2018, nós, eleitores, estaremos mais próximos do que nunca de sentir na pele a complexidade mental vivenciada pelos grandes mestres de xadrez. Afinal, vivemos todos na era da tecnologia em mutação e do big data, expostos, portanto, a um enorme volume de dados. Tal combinação tem implicações na formação e na informação da opinião pública.

Cerca de 2,5 bilhões de novos dados são gerados diariamente na internet. Em um minuto, as pessoas enviam 204 milhões de e-mails, realizam 3 300 000 publicações no Facebook, trocam mais de 29 milhões de mensagens no WhatsApp e assistem a 4 milhões de vídeos no YouTube. Em um mês, são transferidos cerca de 30 exabytes de informações na internet, de acordo com o Discovery Institute. E esses números certamente aumentam a cada dia.

No mundo, até a primeira metade dos anos 1990, usar a internet como ferramenta de informação era algo para poucos. Hoje, já são mais de 3,4 bilhões de pessoas conectadas. No Brasil, já são mais de 100 milhões, segundo o IBGE. O volume de dados criado nos últimos dois anos é maior do que a quantidade produzida em toda a história da humanidade. Só no Google, 3,5 bilhões de buscas são feitas por dia. Diante disso, é bem plausível afirmar que o ambiente digital e a produção exponencial de dados interferem diretamente na maneira de formar, informar e desinformar a opinião pública. E mais: a interferência se dá em espaços de tempo cada vez mais curtos. Com apenas um vídeo, o desconhecido de ontem é a celebridade de hoje.

A convergência de excesso de oferta de informações e acesso contínuo à tecnologia possibilita que tenhamos inúmeros novos elementos para tomar decisão, nos posicionar e, consequentemente, mudar de ideia a cada minuto. Um fenômeno com efeitos ainda pouco mensurados pela academia mundial dedicada a ciências sociais.

Continua após a publicidade

Todavia, uma das consequências conhecidas desse momento se traduz na dificuldade crescente dos institutos em fazer pesquisas de intenção de voto com alto grau de precisão. Esse certamente é um dos fatores que explicam o fato de tantas pesquisas divergirem do resultado das urnas, mesmo quando feitas às vésperas das eleições. Nós, eleitores, somos expostos a uma quantidade de informação e interações digitais por dia infinitamente superior à de dez ou mesmo dois anos atrás. Com isso, o eleitor muda de ideia muito mais rápido e dificulta a vida dos pesquisadores em nível global.

Em 2016, exemplos desse fenômeno pelo mundo não faltaram: a vitória do Brexit no Reino Unido, a eleição de Donald Trump nos Estados Unidos e a derrota do acordo de paz no primeiro referendo realizado na Colômbia. Estimativas conservadoras mostram que o eleitor recebe na última semana antes de votar 150 vezes mais informações relevantes do que recebia dez anos atrás.

As pesquisas de campo ainda operam, em sua maioria, no ambiente mais tradicional, enquanto os eleitores, como sabemos, estão fortemente na era digital e do big data. Esse problema, de maneira mais aparente, passa primeiro pela frequência da realização das pesquisas: é impossível, pelas vias tradicionais, realizar levantamentos de intenção de voto na mesma velocidade/frequência com que quantidades volumosas de informações são disponibilizadas para os votantes. Vejamos um exemplo da experiência americana de 2016. Nos últimos três dias antes da votação, as redes sociais e a mídia em geral foram movimentadas de maneira expressiva por nada menos que 28 fatos novos classificados por estrategistas eleitorais locais como relevantes a ponto de mudar o voto de um eleitor indeciso. Para comparar, em 1989, nos últimos dez dias antes do segundo turno das eleições, somente a revelação do suposto pedido de aborto do ex-presidente Lula a uma ex-namorada foi suficientemente relevante para mudar os rumos do pleito.

Continua após a publicidade

A mudança do cenário nas pesquisas também passa por algo menos explícito: o método de perguntar. Entrebrasilvistados, além de mudar de ideia rapidamente, não necessariamente falam a verdade. Muitos estudos mostram que revelar o voto em Donald Trump em uma pesquisa telefônica não era propriamente motivo de orgulho para uma parcela do eleitorado americano. Como resultado, o potencial de votos do presidente eleito acabou subestimado.

Mas o que o big data tem a ver com isso ? Muito. O futuro da pesquisa de opinião pública passa pelo uso de mais big data e menos perguntas. Por meio da coleta de dados espontânea de redes sociais, web, chats e da telefonia móvel, será possível inferir mais e perguntar menos. Como diria um professor que tive na Universidade de Chicago: “Nada mais enviesado do que perguntar”.

A análise desses milhares de fontes de maneira instantânea será a única forma de acompanhar as flutuações reais da opinião pública. O desafio dos pesquisadores e programadores é e será calibrar os algoritmos e modelos matemáticos para capturar e organizar essas informações de modo a tirar conclusões reais e úteis.

Continua após a publicidade

As eleições presidenciais brasileiras de 2018 serão um tabuleiro de xadrez político altamente complexo. Porém, algo é seguro: será muito difícil acompanhar as flutuações da opinião pública. Quem depender de uma única fonte para isso terá ainda mais dificuldade. Será fundamental a combinação analítica de diversas fontes, ou seja, será essencial navegar pelas ondas do excesso de dados (big data) e transformar tudo isso em informação relevante.

Do eleitor, serão exigidos atributos de mestres do xadrez como Kasparov: a capacidade de processar milhões de possibilidades, descartar as piores alternativas (esperemos todos!), relembrar jogadas já feitas em condições parecidas. Tudo isso numa janela temporal menor que a distância que separa o peão do rei no tabuleiro. Portanto, a vida, como diz o grande mestre russo, imitará o xadrez.

* Presidente da Ideia Big Data e professor de ciências políticas da Universidade George Washington, nos EUA

Publicado em VEJA de 6 de dezembro de 2017, edição nº 2559