Un doveroso ‘reality check’ sui sondaggi pre-elettorali negli Stati Uniti

Dalla sua nomina a candidata democratica per le elezioni presidenziali statunitensi fino all’Election Day, Kamala Harris ha mantenuto percentuali di gradimento pari o superiori a quelle di Donald Trump. Il trionfo inaspettato del candidato repubblicanoha contraddetto l’ottimismo che aveva caratterizzato le previsioni di gran parte dei sondaggisti durante la corsa elettorale: Trump ha riconquistato la Casa Bianca con il 50,5% delle preferenze, vincendo in tutti e sette i Swing States e ottenendo ben 86 grandi elettori in più rispetto alla Candidata Dem, ferma al 48%. Di fronte a risultati così divergenti, è importante ridimensionare l’efficacia predittiva delle statistiche di voto, senza delegittimarne l’utilizzo.

Immagine generate con l’intelligenza artificiale dall’autore.

La statistica delle previsioni: il campionamento casuale

Il metodo più utilizzato dai sondaggisti per costruire una proiezione di voto rappresentativa del risultato finale delle elezioni è il campionamento casuale: gli analisti estraggono randomicamente un gruppo di partecipanti da liste telefoniche e/o postali, oppure conducendo sondaggi online, e li sottopongono ad un questionario(1). Per evitare di sovrarappresentare alcuni gruppi demografici e sottorappresentarne altri, i pollster intervengono con un processo di aggiustamento statistico, detto weighting (ponderazione), correggendo il campione sulla base di fattori come età, etnia, genere, livello di istruzione e provenienza geografica dei suoi membri. Il concetto alla base è molto semplice: non è necessario collezionare le informazioni di tutti i votanti per farsi un’idea precisa delle tendenze politiche della popolazione generale, ne basta un campione. Tuttavia, gli ostacoli che si interpongono all’esattezza dei rilevamenti statistici sono molteplici e, come vedremo, inevitabili.

La sfiducia nei sondaggi e i bias statistici

Il primo ostacolo alla costruzione di un campione di voto affidabile ed equilibrato è strettamente legato all’indisponibilità degli elettori ad essere interpellati: la proliferazione negli ultimi anni di messaggi e chiamate spam ha fatto sì che pochissime persone rispondano ai sondaggi quando non sollecitate. Secondo quanto riportato da UPI, per raccogliere 1.000 risposte, i sondaggisti effettuano più di 20.000 chiamate(2), talvolta accusando il “bias di risposta non partigiana”: un fenomeno per cui i risultati di studi sociologici diventano non rappresentativi perché i partecipanti possiedono in modo sproporzionato determinate caratteristiche che invalidano il risultato dell’indagine, siano queste politiche o demografiche. Nel contesto delle Presidenziali statunitensi, i Repubblicani risultano meno inclini dei Democratici a partecipare ai sondaggi, complice il calo di fiducia tra i conservatori nelle organizzazioni giornalistiche e nelle stesse agenzie di indagine statistica. Specularmente, gli elettori più inclini a compilare i sondaggi online sarebbero i giovani democratici, come riportato dal sondaggista James Johnson al Times of London.

Un’altra sfida significativa consiste nel prevedere chi, tra gli individui selezionati, manterrà la propria parola presentandosi al seggio, tenendo a mente che circa un terzo dei cittadini statunitensi idonei non vota e che gli individui presi in considerazione potrebbero mostrare il bias di risposta per desiderabilità sociale: un fenomeno per cui gli intervistati che non voteranno affermano il contrario, ritenendo la risposta accondiscendente più socialmente accettabile; per gli stessi motivi, rilasciano dichiarazioni false su chi hanno votato alle elezioni precedenti. In questo caso, la desiderabilità sociale peggiora l’accuratezza già precaria del metodo di ponderazione del “voto di richiamo”, ovvero l’integrazione alle risposte degli intervistati delle preferenze elettorali che questi hanno espresso quattro anni prima. Anche nell’ipotesi idealistica di poter ottenere la massima onestà dalle dichiarazioni dei membri del campione, la morfologia generale dell’elettorato di un partito e dell’altro evolve significativamente da un’elezione all’altra: gli elettori deceduti vengono sostituiti dai giovanissimi, spesso difficili da quantificare; inoltre, nel contesto di una Federazione di Stati come gli Stati Uniti d’America, molti cittadini migrano internamente, cambiando, talvolta in modo imprevedibile, gli equilibri assodati nella distribuzione geografica delle preferenze, anche dove queste sono storicamente più omogenee(3). Lo sforzo dei sondaggisti è duplice: non solo è fondamentale includere nei campioni percentuali realistiche per ciascuna categoria di elettori: è cruciale individuare gli “elettori giusti”.

Un esempio di quanto la ponderazione del voto di richiamo possa ingannare: nel 2020, Joe Biden ha vinto tra gli uomini latini con un margine di 23 punti percentuali, mentre il voto del 2024 mostra Trump in vantaggio di dieci punti su Harris. In quattro anni il Tycoon è cresciuto di popolarità per un totale di 18 punti percentuali. Fonte: Edison Research

Il tempismo delle rilevazioni

Un altro elemento da tenere in considerazione quando si ha intenzione di valutare l’accuratezza dei sondaggi è la coincidenza del rilevamento statistico con alcuni eventi imprevisti o particolarmente polarizzanti che possono verificarsi durante la corsa elettorale. Dopo il primo tentativo di omicidio ai danni di Donald Trump, lo scorso 13 luglio, il candidato repubblicano ha monopolizzato la narrativa elettorale. Entro una settimana dall’incidente, i follower di Trump su Instagram sono aumentati di circa un milione ed i sondaggi nazionali gli hanno conferito un vantaggio di 5-6 punti percentuali rispetto al suo allora rivale politico, il Presidente Joe Biden. Inoltre, nei tre giorni successivi alla sparatoria, l’azienda di social media marketing Viralyft ha rivelato un aumento del 500% nelle ricerche su Google in tutto il Paese per “Come registrarsi per votare”.

La crescita nei sondaggi nazionali di Donald Trump dopo il primo tentato omicidio. Fonte: FiveThirtyEight
Lo stacco di Trump su Biden in Pennsylvania, Stato in cui è avvenuto l’incidente, una settimana dopo il fatto. Fonte: 270toWin

Lo stesso è avvenuto dopo il ritiro di Joe Biden dalla corsa elettorale: la rapida ricomposizione della coalizione democratica intorno a Kamala Harris ha ridotto il vantaggio che Trump aveva su Biden solo poche settimane prima, passando da un gap di 6 punti ad vantaggio omogeneo di circa 1-2 punti percentuali da agosto a novembre.

Harris ha recuperato significativamente nelle settimane successive all’ufficializzazione della sua candidatura alla Casa Bianca. Fonte: NYT/Siena College Polls

I sondaggi aggregati

Molti giornalisti tentano di correggere la volatilità dei dati raccolti dai sondaggi individuali facendo affidamento sugli aggregatori: enti che raccolgono estensivamente gli esiti di sondaggi provenienti da diverse fonti per simulare ripetutamente le elezioni ed ottenere una previsione mediana più affidabile. 

I problemi non mancano neanche in questo caso: il primo svantaggio significativo è rappresentato dalla poca trasparenza degli aggregatori nella qualità della raccolta dei propri input, spesso includendo nella propria base dati i risultati di sondaggi non trasparenti nella stima del margine di errore o troppo partigiani di uno schieramento politico. Posto che la qualità di un aggregatore dipende strettamente dalla qualità dei sondaggi stessi, combinare ripetutamente risultati errati non assottiglia l’errore statistico, lo amplifica. 

Un secondo problema è dato dall’impossibilità per gli aggregatori di prevenire il fenomeno dell’herding, ovvero la tendenza di alcuni sondaggisti di aggiustare i propri risultati per allinearsi a quelli ottenuti da altre agenzie, per evitare di essere percepiti come l’unica voce fuori dal coro. Le strategie di herding vanno dalla produzione artificiale di risultati considerati più corretti alla scelta di non pubblicare i dati quando non coincidenti con quelli altrui. In entrambi i casi, gli aggregatori che includessero tali stime nelle proprie simulazioni vedrebbero le proprie previsioni compromesse.

Detto questo, è importante riconoscere che esistono aggregatori più affidabili di altri, in virtù del fatto che tali agenzie hanno la libertà di selezionare le proprie fonti in base a criteri ben definiti, come l’affidabilità storica dei sondaggi, l’orientamento politico dei sondaggisti, l’esclusione di metodi di rilevazione automatizzati approssimativi e le policy di trasparenza in vigore(4). Ciononostante, anche le organizzazioni più affidabili possono sbagliare, e non di poco: nel 2016, secondo i calcoli pubblicati dal sito di aggregazione FiveThirtyEight dopo migliaia di simulazioni, Hillary Clinton avrebbe vinto nel 71,4% dei casi; nel 2024, la stessa agenzia ha sottostimato l’ondata repubblicana fino a quasi quattro punti percentuali, oltre il margine di errore standard, normalmente fermo al 3% ogni 1000 individui intervistati.(5)

Le stime aggregate di FiveThirtyEight durante le Elezioni Presidenziali del 2016.
Le stime aggregate di FiveThirtyEight, 8 anni dopo.

Conclusioni

Nonostante i sondaggi non siano sempre efficaci nella costruzione di aspettative di voto realistiche, rimangono lo strumento più utile a disposizione per indagare le preferenze elettorali della popolazione generale. Non solo, diversi studi mostrano come le proiezioni di voto possano avere un effetto significativo sui risultati finali. 

Una volta presa coscienza delle tendenze elettorali, gli elettori potrebbero scegliere di votare in modo strategico: rinunciare al proprio candidato o partito preferito, se considerato poco competitivo, per evitare di “sprecare” il voto. Al contempo, potrebbe manifestarsi l’effetto del contagio (Bandwagon Effect): gli elettori indecisi tenderebbero a sostenere il candidato in testa, proprio per la sua posizione di vantaggio, affidandosi al consenso della maggioranza. Infine, non si può escludere il cosiddetto Underdog Effect, ovvero un moto di simpatia verso il candidato sfavorito, percepito come un outsider che merita una chance.

In ogni caso, è importante apprezzare i sondaggi per quello che sono: istantanee approssimative delle preferenze politiche delle masse, intrinsecamente volubili e inesatte. I numeri, per quanto ottenuti in modo affidabile, trasparente e metodologicamente impeccabile, saranno sempre e solo validi come strumenti di indagine parziale. Come si dice nell’ambiente, “Election Day is the only poll that matters” - l’unico sondaggio che conta, sono le elezioni stesse.

Ti è piaciuto questo articolo? Supporta la nostra associazione: associati oppure effettua una donazione.
Il tuo sostegno è per noi importante!

DONA ORAASSOCIATI

Indietro

Non si finisce mai di studiare? | Lifelong learning

di A. Minuzzo

Considerato uno degli indicatori per la valutazione dei Paesi dell’Unione Europea, il “lifelong…

Teatro alla Scala: Fascinazione per la "grande cultura russa" o complicità con un regime?

di T. Bezruchenko

La guerra in Ucraina non è iniziata nel 2022. È cominciata nel 2014, con l’annessione illegale della…

Dietro la caduta di Assad: tutte le fasi dell’offensiva di Hay'at Tahrir Al-Sham

di M. Fadda

Il 27 novembre 2024, i gruppi ribelli siriani guidati da Hay’at Tahrir al-Sham (HTS, “Organizzazione…