Desde a semana passada, muitos leitores solicitaram uma explicação mais detalhada sobre amostragem e margem de erro. Vou utilizar um exemplo bem simples para facilitar a explicação. Imagine uma piscina de bolinhas coloridas, dessas encontradas nas festas infantis. Agora imagine uma grande piscina com 100.000 bolinhas, das mais variadas cores. Imagine ainda que 30 % das bolinhas sejam amarelas. Digamos que um sujeito, desconfiado da eficácia das pesquisas por amostragem, faça o seguinte desafio a um estatístico: "Duvido que você consiga me dizer qual é o porcentual de bolinhas amarelas desta piscina". O estatístico aceita o desafio, mas responde: eu não posso apresentar o número correto de bolinhas amarelas, mas se retirar 1.000 bolinhas da piscina, posso oferecer um intervalo de porcentuais, que provavelmente conterá o porcentual correto da bolinhas. Desafio aceito, o estatístico retira aleatoriamente, com um balde, 1.000 bolinhas da piscina. Depois conta o total de bolinhas amarelas (310); ou seja, 31%. Depois de alguns cálculos, ele apresenta o seu veredicto: "Existem na piscina entre 27% e 33% de bolinhas amarelas".
O sujeito desconfiado do princípio da amostragem lança um novo desafio para o estatístico: "Agora duvido que você acerte o percentual de bolas amarelas em uma piscina olímpica com 5 milhões de bolinhas". O estatístico aceita novamente o desafio e, para surpresa geral, retira as mesmas 1.000 bolinhas, conta-as e encontra 29% de amarelas. Novamente, o número encontrado está no intervalo previsto (27% e 33%).
O cético e o estatístico
É importante lembrar que em nenhum momento o estatístico prometeu acertar o número preciso de bolas amarelas, mas sim apresentar "um intervalo de porcentuais, que provavelmente conteria o porcentual correto" conhecido para o total das 5 milhões de bolinhas. Esse intervalo é chamado de margem de erro. Uma das descobertas mais incríveis da história da matemática é a de que a margem de erro de uma pesquisa por amostra está associada ao tamanho da amostra e não ao da população total. Sabendo disso, o estatístico retirou as mesmas 1.000 bolinhas da piscina de 100.000 ou de 5 milhões de unidades. E os resultados bem aproximados das duas amostras devem ter convencido o cético da eficiência da pesquisa. Mas este continuou com uma dúvida: "E se aumentarmos a amostra não seremos capazes de reduzir a margem de erro?" A resposta é sim. Aumentar a amostra é garantir uma diminuição da margem de erro e aumentar a precisão da estimativa. Se 5.000 bolinhas fossem retiradas da piscina, por exemplo, a margem de erro cairia para cerca de 1 ponto percentual.
As pesquisas de opinião realizadas durante as campanhas eleitorais seguem o mesmo princípio. Os institutos entrevistam um número reduzido de indivíduos, perguntam a estes em quem vão votar. Os dados são apurados e apresentados: Fulano têm 42%, Beltrano, 38%, brancos, nulos e indecisos somam 20%. O tamanho da amostra (número de entrevistados) permite que institutos calculem a margem de erro máxima da pesquisa realizada.
O atraente e o correto
Por mais que as pesquisas sejam acompanhadas da margem de erro, acabamos nos concentrando no percentual que cada candidato recebe. Por exemplo, na última pesquisa do Datafolha feita no Rio de Janeiro (margem de erro máxima de 3 pontos), o candidato Marcelo Crivella (PRB) está com 24%. Essa é a informação que parece importar. Mas o que uma pesquisa amostral nos permite dizer é que existe uma altíssima probabilidade de que o candidato Crivella tenha hoje algo entre 21% e 27% dos votos. Sei que dito desta maneira as pesquisas parecem perder muito de seu encanto. Mas esta é a forma correta de interpretar os dados.
No parágrafo anterior falei de margem de erro máxima. Na realidade, para facilitar a comunicação com eleitores, os institutos apresentam uma margem de erro para toda a pesquisa. Mas a margem oscila segundo o percentual de votos do candidato. No quadro abaixo calculo a margem de erro dos candidatos da pesquisa Datafolha feita na cidade do Rio de Janeiro. O intervalo da última coluna provavelmente contém o porcentual de votos de cada candidato. Observe que por esses dados tanto Jandira Fegalli (PCdoB), como Eduardo Paes (PMDB) podem estar em segundo lugar. Quando isso acontece, os institutos costumam dizer que existe um empate técnico.
Quadro: Pesquisa Datafolha (23/24 julho) no Rio de Janeiro. Cálculo da Margem de Erro de cada candidato:
Candidato | Percentual | Margem de Erro | Intervalo |
Marcelo Crivella (PRB) | 24 | 2,7 | 21,3 - 26,7 |
Jandira Fegalli (PCdoB) | 16 | 2,4 | 13,6 - 18,4 |
Eduardo Paes (PMDB) | 13 | 2,2 | 10,8 - 15,2 |
Fernando Gabeira (PV) | 7 | 1,6 | 5,4 - 8,6 |
Solange Amaral (DEM) | 5 | 1,4 | 3,6 - 6,4 |
Chico Alencar (PSOL) | 3 | 1,1 | 1,9 - 4,1 |
Molon (PT) | 2 | 0,9 | 1,1 - 2,9 |
Paulo Ramos (PDT) | 2 | 0,9 | 1,1 - 2,9 |
Vinicius Cordeiro (PTdoB) | 1 | 0,4 | 0,6 - 1,4 |
Indeciso | 10 | 1,9 | 8,1 - 11,9 |
Brancos e Nulos | 16 | 2,4 | 13,6 - 18,4 |
Na próxima coluna vamos falar sobre como os três maiores institutos de pesquisa do Brasil (Datafolha, Ibope e Vox Populli) fazem as suas pesquisa.
flavio - Parabens pelo trabalho!Eu gostaria de saber a piniao de um expert sobre se as pesquisas de opiniao em cidades de porte menor, poe ex 10 mil habitantes, poderiamos dizer que a margem de precisao de uma pesquisa é menor?Seria muito grato se pedesse tirar minha duvida.ATENCIOSAMENTE
Conrado H Duarte - Adorei esta coluna. O professor é, como não poderia deixar de ser, extremamente didático. Mais claro do que estas explicações, só desenhando. Acho ótimo que um cientista político sério e competente participe, socializando informações de interesse da totalidade do eleitorado.Só não entendo uma coisa: a Veja sempre, a exemplo de outras revistas cobre as eleições antes, durante e depois. Por que não levar a coluna para a revista também? Os eleitores que têm acesso a internet são poucos se comparados ao tamanho dos leitores da revista, acredito eu. Sendo a revista também de utilidade pública, deveria apliar o acesso a seus assinantes, aos leitores eventuais. A revista só teria a ganhar com esta coluna e nós, os eleitores, também. Parabéns professor Jairo, adorei suas explicações. Estarei aqui aguardando seus comentários sobre os institut
batista cruz - jairo, pq vc nao coloca as respostas das perguntas na rede? seria por demais interessante para todos nos que nos interessamos por pesquisas eleitorais. mas a sua coluna está esclarecedora. sou jornalista e passei, como todos leitores de veja, uma otima opção para analisar as pesquisas que nos sao apresentadas. parabens
L. Miloski - Parabéns Jairo. Você conseguiu se apropriar deste espaço por meio de um conteúdo esclarecedor e de fácil compreensão.Uma coluna como esta na revista impressa seria altamente bem recebida.Deixo aí a minha dica.
Fabio de Carvalho - Interessante. Mas o tamanho relativo da amostra em relação à população total não influencia a PROBABILIDADE de a distribuição real estar realmente dentro da margem de erro?
antonio josé - MUITO EFICIENTE A ANALOGIA MAS GOSTARIA DE SABER SE DEVIDO AOS CHAMADOS "CURRAIS ELEITORAIS"NÃO PODEM APARECER SURPRESAS COMO O FENOMENO "GLAUBER" EM NOVA FRIBURGO OU O DO PIPOQUEIRO DE SÃO FIDELIS
Gabriel - Compreendi, através deste quadro, que a mergem de erro varia para cada candidato. Porque os institutos anunciam um único valor para margem de erro?
Sonia - Ótima explicação. Pareceu-me, portanto, que pesquisas sérias por amostragem devem considerar um número mínimo de 1000 eleitores para que a margem de erro não seja tão grande. Os institutos obedecem este critério? Outra pergunta: as amostras são aleatórias ou seguem critérios?