Un doveroso ‘reality check’ sui sondaggi pre-elettorali negli Stati Uniti

di M. Fadda

25/11/2024

Dalla sua nomina a candidata democratica per le elezioni presidenziali statunitensi fino all’Election Day, Kamala Harris ha mantenuto percentuali di gradimento pari o superiori a quelle di Donald Trump. Il trionfo inaspettato del candidato repubblicanoha contraddetto l’ottimismo che aveva caratterizzato le previsioni di gran parte dei sondaggisti durante la corsa elettorale: Trump ha riconquistato la Casa Bianca con il 50,5% delle preferenze, vincendo in tutti e sette i Swing States e ottenendo ben 86 grandi elettori in più rispetto alla Candidata Dem, ferma al 48%. Di fronte a risultati così divergenti, è importante ridimensionare l’efficacia predittiva delle statistiche di voto, senza delegittimarne l’utilizzo.

La statistica delle previsioni: il campionamento casuale

Il metodo più utilizzato dai sondaggisti per costruire una proiezione di voto rappresentativa del risultato finale delle elezioni è il campionamento casuale: gli analisti estraggono randomicamente un gruppo di partecipanti da liste telefoniche e/o postali, oppure conducendo sondaggi online, e li sottopongono ad un questionario(1). Per evitare di sovrarappresentare alcuni gruppi demografici e sottorappresentarne altri, i pollster intervengono con un processo di aggiustamento statistico, detto weighting (ponderazione), correggendo il campione sulla base di fattori come età, etnia, genere, livello di istruzione e provenienza geografica dei suoi membri. Il concetto alla base è molto semplice: non è necessario collezionare le informazioni di tutti i votanti per farsi un’idea precisa delle tendenze politiche della popolazione generale, ne basta un campione. Tuttavia, gli ostacoli che si interpongono all’esattezza dei rilevamenti statistici sono molteplici e, come vedremo, inevitabili.

La sfiducia nei sondaggi e i bias statistici

Il primo ostacolo alla costruzione di un campione di voto affidabile ed equilibrato è strettamente legato all’indisponibilità degli elettori ad essere interpellati: la proliferazione negli ultimi anni di messaggi e chiamate spam ha fatto sì che pochissime persone rispondano ai sondaggi quando non sollecitate. Secondo quanto riportato da UPI, per raccogliere 1.000 risposte, i sondaggisti effettuano più di 20.000 chiamate(2), talvolta accusando il “bias di risposta non partigiana”: un fenomeno per cui i risultati di studi sociologici diventano non rappresentativi perché i partecipanti possiedono in modo sproporzionato determinate caratteristiche che invalidano il risultato dell’indagine, siano queste politiche o demografiche. Nel contesto delle Presidenziali statunitensi, i Repubblicani risultano meno inclini dei Democratici a partecipare ai sondaggi, complice il calo di fiducia tra i conservatori nelle organizzazioni giornalistiche e nelle stesse agenzie di indagine statistica. Specularmente, gli elettori più inclini a compilare i sondaggi online sarebbero i giovani democratici, come riportato dal sondaggista James Johnson al Times of London.

Un’altra sfida significativa consiste nel prevedere chi, tra gli individui selezionati, manterrà la propria parola presentandosi al seggio, tenendo a mente che circa un terzo dei cittadini statunitensi idonei non vota e che gli individui presi in considerazione potrebbero mostrare il bias di risposta per desiderabilità sociale: un fenomeno per cui gli intervistati che non voteranno affermano il contrario, ritenendo la risposta accondiscendente più socialmente accettabile; per gli stessi motivi, rilasciano dichiarazioni false su chi hanno votato alle elezioni precedenti. In questo caso, la desiderabilità sociale peggiora l’accuratezza già precaria del metodo di ponderazione del “voto di richiamo”, ovvero l’integrazione alle risposte degli intervistati delle preferenze elettorali che questi hanno espresso quattro anni prima. Anche nell’ipotesi idealistica di poter ottenere la massima onestà dalle dichiarazioni dei membri del campione, la morfologia generale dell’elettorato di un partito e dell’altro evolve significativamente da un’elezione all’altra: gli elettori deceduti vengono sostituiti dai giovanissimi, spesso difficili da quantificare; inoltre, nel contesto di una Federazione di Stati come gli Stati Uniti d’America, molti cittadini migrano internamente, cambiando, talvolta in modo imprevedibile, gli equilibri assodati nella distribuzione geografica delle preferenze, anche dove queste sono storicamente più omogenee(3). Lo sforzo dei sondaggisti è duplice: non solo è fondamentale includere nei campioni percentuali realistiche per ciascuna categoria di elettori: è cruciale individuare gli “elettori giusti”.

Un esempio di quanto la ponderazione del voto di richiamo possa ingannare: nel 2020, Joe Biden ha vinto tra gli uomini latini con un margine di 23 punti percentuali, mentre il voto del 2024 mostra Trump in vantaggio di dieci punti su Harris. In quattro anni il Tycoon è cresciuto di popolarità per un totale di 18 punti percentuali. Fonte: Edison Research

Il tempismo delle rilevazioni

Un altro elemento da tenere in considerazione quando si ha intenzione di valutare l’accuratezza dei sondaggi è la coincidenza del rilevamento statistico con alcuni eventi imprevisti o particolarmente polarizzanti che possono verificarsi durante la corsa elettorale. Dopo il primo tentativo di omicidio ai danni di Donald Trump, lo scorso 13 luglio, il candidato repubblicano ha monopolizzato la narrativa elettorale. Entro una settimana dall’incidente, i follower di Trump su Instagram sono aumentati di circa un milione ed i sondaggi nazionali gli hanno conferito un vantaggio di 5-6 punti percentuali rispetto al suo allora rivale politico, il Presidente Joe Biden. Inoltre, nei tre giorni successivi alla sparatoria, l’azienda di social media marketing Viralyft ha rivelato un aumento del 500% nelle ricerche su Google in tutto il Paese per “Come registrarsi per votare”.

La crescita nei sondaggi nazionali di Donald Trump dopo il primo tentato omicidio. Fonte: FiveThirtyEight

Lo stacco di Trump su Biden in Pennsylvania, Stato in cui è avvenuto l’incidente, una settimana dopo il fatto. Fonte: 270toWin

Lo stesso è avvenuto dopo il ritiro di Joe Biden dalla corsa elettorale: la rapida ricomposizione della coalizione democratica intorno a Kamala Harris ha ridotto il vantaggio che Trump aveva su Biden solo poche settimane prima, passando da un gap di 6 punti ad vantaggio omogeneo di circa 1-2 punti percentuali da agosto a novembre.

Harris ha recuperato significativamente nelle settimane successive all’ufficializzazione della sua candidatura alla Casa Bianca. Fonte: NYT/Siena College Polls

I sondaggi aggregati

Molti giornalisti tentano di correggere la volatilità dei dati raccolti dai sondaggi individuali facendo affidamento sugli aggregatori: enti che raccolgono estensivamente gli esiti di sondaggi provenienti da diverse fonti per simulare ripetutamente le elezioni ed ottenere una previsione mediana più affidabile.

I problemi non mancano neanche in questo caso: il primo svantaggio significativo è rappresentato dalla poca trasparenza degli aggregatori nella qualità della raccolta dei propri input, spesso includendo nella propria base dati i risultati di sondaggi non trasparenti nella stima del margine di errore o troppo partigiani di uno schieramento politico. Posto che la qualità di un aggregatore dipende strettamente dalla qualità dei sondaggi stessi, combinare ripetutamente risultati errati non assottiglia l’errore statistico, lo amplifica.

Un secondo problema è dato dall’impossibilità per gli aggregatori di prevenire il fenomeno dell’herding, ovvero la tendenza di alcuni sondaggisti di aggiustare i propri risultati per allinearsi a quelli ottenuti da altre agenzie, per evitare di essere percepiti come l’unica voce fuori dal coro. Le strategie di herding vanno dalla produzione artificiale di risultati considerati più corretti alla scelta di non pubblicare i dati quando non coincidenti con quelli altrui. In entrambi i casi, gli aggregatori che includessero tali stime nelle proprie simulazioni vedrebbero le proprie previsioni compromesse.

Detto questo, è importante riconoscere che esistono aggregatori più affidabili di altri, in virtù del fatto che tali agenzie hanno la libertà di selezionare le proprie fonti in base a criteri ben definiti, come l’affidabilità storica dei sondaggi, l’orientamento politico dei sondaggisti, l’esclusione di metodi di rilevazione automatizzati approssimativi e le policy di trasparenza in vigore(4). Ciononostante, anche le organizzazioni più affidabili possono sbagliare, e non di poco: nel 2016, secondo i calcoli pubblicati dal sito di aggregazione FiveThirtyEight dopo migliaia di simulazioni, Hillary Clinton avrebbe vinto nel 71,4% dei casi; nel 2024, la stessa agenzia ha sottostimato l’ondata repubblicana fino a quasi quattro punti percentuali, oltre il margine di errore standard, normalmente fermo al 3% ogni 1000 individui intervistati.(5)

Le stime aggregate di FiveThirtyEight durante le Elezioni Presidenziali del 2016.

Le stime aggregate di FiveThirtyEight, 8 anni dopo.

Conclusioni

Nonostante i sondaggi non siano sempre efficaci nella costruzione di aspettative di voto realistiche, rimangono lo strumento più utile a disposizione per indagare le preferenze elettorali della popolazione generale. Non solo, diversi studi mostrano come le proiezioni di voto possano avere un effetto significativo sui risultati finali.

Una volta presa coscienza delle tendenze elettorali, gli elettori potrebbero scegliere di votare in modo strategico: rinunciare al proprio candidato o partito preferito, se considerato poco competitivo, per evitare di “sprecare” il voto. Al contempo, potrebbe manifestarsi l’effetto del contagio (Bandwagon Effect): gli elettori indecisi tenderebbero a sostenere il candidato in testa, proprio per la sua posizione di vantaggio, affidandosi al consenso della maggioranza. Infine, non si può escludere il cosiddetto Underdog Effect, ovvero un moto di simpatia verso il candidato sfavorito, percepito come un outsider che merita una chance.

In ogni caso, è importante apprezzare i sondaggi per quello che sono: istantanee approssimative delle preferenze politiche delle masse, intrinsecamente volubili e inesatte. I numeri, per quanto ottenuti in modo affidabile, trasparente e metodologicamente impeccabile, saranno sempre e solo validi come strumenti di indagine parziale. Come si dice nell’ambiente, “Election Day is the only poll that matters” - l’unico sondaggio che conta, sono le elezioni stesse.

Ti è piaciuto questo articolo? Supporta la nostra associazione: associati oppure effettua una donazione.
Il tuo sostegno è per noi importante!

DONA ORA ASSOCIATI

Indietro

Nome	Fornitore	Scopo	Scadenza	Tipo
rc::a	google.com	Questo cookie è usato per distinguere tra umani e robot. Questo è utile per il sito web, al fine di rendere validi rapporti sull'uso del sito.	Persistent	HTML Local Storage
rc::c	google.com	Questo cookie è usato per distinguere tra umani e robot.	Session	HTML Local Storage
CookieConsent	liberioltreleillusioni.it	Memorizza lo stato del consenso ai cookie dell'utente per il dominio corrente	365 giorni	HTTP Cookie
__cfduid	liberioltreleillusioni.it	Utilizzato dalla rete di contenuti, Cloudflare, per identificare traffico web affidabile.	29 giorni	HTTP Cookie
local_storage_support_test	twitter.com	Il cookie viene utilizzato contestualmente alla funzione di archiviazione locale nel browser. Questa funzione consente al sito di caricarsi più velocemente pre-caricando determinate procedure.	Persistent	HTML Local Storage

Nome	Fornitore	Scopo	Scadenza	Tipo
_ga_#	liberioltreleillusioni.it	Utilizzato da Google Analytics per raccogliere dati sul numero di volte che un utente ha visitato il sito internet, oltre che le dati per la prima visita e la visita più recente.	729 giorni	HTTP Cookie
_ga	liberioltreleillusioni.it	Registra un ID univoco utilizzato per generare dati statistici su come il visitatore utilizza il sito internet.	729 giorni	HTTP Cookie

Nome	Fornitore	Scopo	Scadenza	Tipo
test_cookie	doubleclick.net	Utilizzato per verificare se il browser dell'utente supporta i cookie.	1 giorni	HTTP Cookie
IDE	doubleclick.net	Utilizzato da Google DoubleClick per registrare e produrre resoconti sulle azioni dell'utente sul sito dopo aver visualizzato o cliccato una delle pubblicità dell'inserzionista al fine di misurare l'efficacia di una pubblicità e presentare pubblicità mirata all'utente.	729 giorni	HTTP Cookie
i/jot	twitter.com	Imposta un ID univoco per il visitatore, che consente agli inserzionisti di terze parti di indirizzare pubblicità pertinente al visitatore. Questo servizio di abbinamento è fornito da hub di pubblicità di terze parti, che facilitano le offerte in tempo reale per gli inserzionisti.	Session	Pixel Tracker
__widgetsettings	twitter.com	Questo cookie è impostato da Twitter - Il cookie consente al'utente di condividere contenuti dal sito web sul proprio profilo Twitter.	Persistent	HTML Local Storage
YSC	youtube.com	Registra un ID univoco per statistiche legate a quali video YouTube sono stati visualizzati dall'utente.	Session	HTTP Cookie
VISITOR_INFO1_LIVE	youtube.com	Prova a stimare la velocità della connessione dell'utente su pagine con video YouTube integrati.	179 giorni	HTTP Cookie
yt-remote-device-id	youtube-nocookie.com	Memorizza le preferenze del lettore video dell'utente usando il video YouTube incorporato	Persistent	HTML Local Storage
yt-remote-connected-devices	youtube-nocookie.com	Memorizza le preferenze del lettore video dell'utente usando il video YouTube incorporato	Persistent	HTML Local Storage
yt-remote-session-app	youtube-nocookie.com	Memorizza le preferenze del lettore video dell'utente usando il video YouTube incorporato	Session	HTML Local Storage
yt-remote-cast-installed	youtube-nocookie.com	Memorizza le preferenze del lettore video dell'utente usando il video YouTube incorporato	Session	HTML Local Storage
yt-remote-session-name	youtube-nocookie.com	Memorizza le preferenze del lettore video dell'utente usando il video YouTube incorporato	Session	HTML Local Storage
yt-remote-fast-check-period	youtube-nocookie.com	Memorizza le preferenze del lettore video dell'utente usando il video YouTube incorporato	Session	HTML Local Storage

Un doveroso ‘reality check’ sui sondaggi pre-elettorali negli Stati Uniti

di M. Fadda

La statistica delle previsioni: il campionamento casuale

La sfiducia nei sondaggi e i bias statistici

Il tempismo delle rilevazioni

I sondaggi aggregati

Conclusioni

L’incendio del centro commerciale Marywilska 44 e le ingerenze russe in Polonia e Lituania

Merz e l’alba di una nuova Germania

La metamorfosi di Prato: dal distretto tessile al pronto moda

Questo sito web utilizza i cookie

Un doveroso ‘reality check’ sui sondaggi pre-elettorali negli Stati Uniti

di M. Fadda

La statistica delle previsioni: il campionamento casuale

La sfiducia nei sondaggi e i bias statistici

Il tempismo delle rilevazioni

I sondaggi aggregati

Conclusioni

Articoli e post correlati

Approfondimenti

Keywords

L’incendio del centro commerciale Marywilska 44 e le ingerenze russe in Polonia e Lituania

Merz e l’alba di una nuova Germania

La metamorfosi di Prato: dal distretto tessile al pronto moda