Dalla sua nomina a candidata democratica per le elezioni presidenziali statunitensi fino all’Election Day, Kamala Harris ha mantenuto percentuali di gradimento pari o superiori a quelle di Donald Trump. Il trionfo inaspettato del candidato repubblicanoha contraddetto l’ottimismo che aveva caratterizzato le previsioni di gran parte dei sondaggisti durante la corsa elettorale: Trump ha riconquistato la Casa Bianca con il 50,5% delle preferenze, vincendo in tutti e sette i Swing States e ottenendo ben 86 grandi elettori in più rispetto alla Candidata Dem, ferma al 48%. Di fronte a risultati così divergenti, è importante ridimensionare l’efficacia predittiva delle statistiche di voto, senza delegittimarne l’utilizzo.
Il metodo più utilizzato dai sondaggisti per costruire una proiezione di voto rappresentativa del risultato finale delle elezioni è il campionamento casuale: gli analisti estraggono randomicamente un gruppo di partecipanti da liste telefoniche e/o postali, oppure conducendo sondaggi online, e li sottopongono ad un questionario(1). Per evitare di sovrarappresentare alcuni gruppi demografici e sottorappresentarne altri, i pollster intervengono con un processo di aggiustamento statistico, detto weighting (ponderazione), correggendo il campione sulla base di fattori come età, etnia, genere, livello di istruzione e provenienza geografica dei suoi membri. Il concetto alla base è molto semplice: non è necessario collezionare le informazioni di tutti i votanti per farsi un’idea precisa delle tendenze politiche della popolazione generale, ne basta un campione. Tuttavia, gli ostacoli che si interpongono all’esattezza dei rilevamenti statistici sono molteplici e, come vedremo, inevitabili.
Il primo ostacolo alla costruzione di un campione di voto affidabile ed equilibrato è strettamente legato all’indisponibilità degli elettori ad essere interpellati: la proliferazione negli ultimi anni di messaggi e chiamate spam ha fatto sì che pochissime persone rispondano ai sondaggi quando non sollecitate. Secondo quanto riportato da UPI, per raccogliere 1.000 risposte, i sondaggisti effettuano più di 20.000 chiamate(2), talvolta accusando il “bias di risposta non partigiana”: un fenomeno per cui i risultati di studi sociologici diventano non rappresentativi perché i partecipanti possiedono in modo sproporzionato determinate caratteristiche che invalidano il risultato dell’indagine, siano queste politiche o demografiche. Nel contesto delle Presidenziali statunitensi, i Repubblicani risultano meno inclini dei Democratici a partecipare ai sondaggi, complice il calo di fiducia tra i conservatori nelle organizzazioni giornalistiche e nelle stesse agenzie di indagine statistica. Specularmente, gli elettori più inclini a compilare i sondaggi online sarebbero i giovani democratici, come riportato dal sondaggista James Johnson al Times of London.
Un’altra sfida significativa consiste nel prevedere chi, tra gli individui selezionati, manterrà la propria parola presentandosi al seggio, tenendo a mente che circa un terzo dei cittadini statunitensi idonei non vota e che gli individui presi in considerazione potrebbero mostrare il bias di risposta per desiderabilità sociale: un fenomeno per cui gli intervistati che non voteranno affermano il contrario, ritenendo la risposta accondiscendente più socialmente accettabile; per gli stessi motivi, rilasciano dichiarazioni false su chi hanno votato alle elezioni precedenti. In questo caso, la desiderabilità sociale peggiora l’accuratezza già precaria del metodo di ponderazione del “voto di richiamo”, ovvero l’integrazione alle risposte degli intervistati delle preferenze elettorali che questi hanno espresso quattro anni prima. Anche nell’ipotesi idealistica di poter ottenere la massima onestà dalle dichiarazioni dei membri del campione, la morfologia generale dell’elettorato di un partito e dell’altro evolve significativamente da un’elezione all’altra: gli elettori deceduti vengono sostituiti dai giovanissimi, spesso difficili da quantificare; inoltre, nel contesto di una Federazione di Stati come gli Stati Uniti d’America, molti cittadini migrano internamente, cambiando, talvolta in modo imprevedibile, gli equilibri assodati nella distribuzione geografica delle preferenze, anche dove queste sono storicamente più omogenee(3). Lo sforzo dei sondaggisti è duplice: non solo è fondamentale includere nei campioni percentuali realistiche per ciascuna categoria di elettori: è cruciale individuare gli “elettori giusti”.
Un altro elemento da tenere in considerazione quando si ha intenzione di valutare l’accuratezza dei sondaggi è la coincidenza del rilevamento statistico con alcuni eventi imprevisti o particolarmente polarizzanti che possono verificarsi durante la corsa elettorale. Dopo il primo tentativo di omicidio ai danni di Donald Trump, lo scorso 13 luglio, il candidato repubblicano ha monopolizzato la narrativa elettorale. Entro una settimana dall’incidente, i follower di Trump su Instagram sono aumentati di circa un milione ed i sondaggi nazionali gli hanno conferito un vantaggio di 5-6 punti percentuali rispetto al suo allora rivale politico, il Presidente Joe Biden. Inoltre, nei tre giorni successivi alla sparatoria, l’azienda di social media marketing Viralyft ha rivelato un aumento del 500% nelle ricerche su Google in tutto il Paese per “Come registrarsi per votare”.
Lo stesso è avvenuto dopo il ritiro di Joe Biden dalla corsa elettorale: la rapida ricomposizione della coalizione democratica intorno a Kamala Harris ha ridotto il vantaggio che Trump aveva su Biden solo poche settimane prima, passando da un gap di 6 punti ad vantaggio omogeneo di circa 1-2 punti percentuali da agosto a novembre.
Molti giornalisti tentano di correggere la volatilità dei dati raccolti dai sondaggi individuali facendo affidamento sugli aggregatori: enti che raccolgono estensivamente gli esiti di sondaggi provenienti da diverse fonti per simulare ripetutamente le elezioni ed ottenere una previsione mediana più affidabile.
I problemi non mancano neanche in questo caso: il primo svantaggio significativo è rappresentato dalla poca trasparenza degli aggregatori nella qualità della raccolta dei propri input, spesso includendo nella propria base dati i risultati di sondaggi non trasparenti nella stima del margine di errore o troppo partigiani di uno schieramento politico. Posto che la qualità di un aggregatore dipende strettamente dalla qualità dei sondaggi stessi, combinare ripetutamente risultati errati non assottiglia l’errore statistico, lo amplifica.
Un secondo problema è dato dall’impossibilità per gli aggregatori di prevenire il fenomeno dell’herding, ovvero la tendenza di alcuni sondaggisti di aggiustare i propri risultati per allinearsi a quelli ottenuti da altre agenzie, per evitare di essere percepiti come l’unica voce fuori dal coro. Le strategie di herding vanno dalla produzione artificiale di risultati considerati più corretti alla scelta di non pubblicare i dati quando non coincidenti con quelli altrui. In entrambi i casi, gli aggregatori che includessero tali stime nelle proprie simulazioni vedrebbero le proprie previsioni compromesse.
Detto questo, è importante riconoscere che esistono aggregatori più affidabili di altri, in virtù del fatto che tali agenzie hanno la libertà di selezionare le proprie fonti in base a criteri ben definiti, come l’affidabilità storica dei sondaggi, l’orientamento politico dei sondaggisti, l’esclusione di metodi di rilevazione automatizzati approssimativi e le policy di trasparenza in vigore(4). Ciononostante, anche le organizzazioni più affidabili possono sbagliare, e non di poco: nel 2016, secondo i calcoli pubblicati dal sito di aggregazione FiveThirtyEight dopo migliaia di simulazioni, Hillary Clinton avrebbe vinto nel 71,4% dei casi; nel 2024, la stessa agenzia ha sottostimato l’ondata repubblicana fino a quasi quattro punti percentuali, oltre il margine di errore standard, normalmente fermo al 3% ogni 1000 individui intervistati.(5)
Nonostante i sondaggi non siano sempre efficaci nella costruzione di aspettative di voto realistiche, rimangono lo strumento più utile a disposizione per indagare le preferenze elettorali della popolazione generale. Non solo, diversi studi mostrano come le proiezioni di voto possano avere un effetto significativo sui risultati finali.
Una volta presa coscienza delle tendenze elettorali, gli elettori potrebbero scegliere di votare in modo strategico: rinunciare al proprio candidato o partito preferito, se considerato poco competitivo, per evitare di “sprecare” il voto. Al contempo, potrebbe manifestarsi l’effetto del contagio (Bandwagon Effect): gli elettori indecisi tenderebbero a sostenere il candidato in testa, proprio per la sua posizione di vantaggio, affidandosi al consenso della maggioranza. Infine, non si può escludere il cosiddetto Underdog Effect, ovvero un moto di simpatia verso il candidato sfavorito, percepito come un outsider che merita una chance.
In ogni caso, è importante apprezzare i sondaggi per quello che sono: istantanee approssimative delle preferenze politiche delle masse, intrinsecamente volubili e inesatte. I numeri, per quanto ottenuti in modo affidabile, trasparente e metodologicamente impeccabile, saranno sempre e solo validi come strumenti di indagine parziale. Come si dice nell’ambiente, “Election Day is the only poll that matters” - l’unico sondaggio che conta, sono le elezioni stesse.
Ti è piaciuto questo articolo? Supporta la nostra associazione: associati oppure effettua una donazione.
Il tuo sostegno è per noi importante!