La statistica delle previsioni: il campionamento casuale
Il metodo più utilizzato dai sondaggisti per costruire una proiezione di voto rappresentativa del risultato finale delle elezioni è il campionamento casuale: gli analisti estraggono randomicamente un gruppo di partecipanti da liste telefoniche e/o postali, oppure conducendo sondaggi online, e li sottopongono ad un questionario(1). Per evitare di sovrarappresentare alcuni gruppi demografici e sottorappresentarne altri, i pollster intervengono con un processo di aggiustamento statistico, detto weighting (ponderazione), correggendo il campione sulla base di fattori come età, etnia, genere, livello di istruzione e provenienza geografica dei suoi membri. Il concetto alla base è molto semplice: non è necessario collezionare le informazioni di tutti i votanti per farsi un’idea precisa delle tendenze politiche della popolazione generale, ne basta un campione. Tuttavia, gli ostacoli che si interpongono all’esattezza dei rilevamenti statistici sono molteplici e, come vedremo, inevitabili.
La sfiducia nei sondaggi e i bias statistici
Il primo ostacolo alla costruzione di un campione di voto affidabile ed equilibrato è strettamente legato all’indisponibilità degli elettori ad essere interpellati: la proliferazione negli ultimi anni di messaggi e chiamate spam ha fatto sì che pochissime persone rispondano ai sondaggi quando non sollecitate. Secondo quanto riportato da UPI, per raccogliere 1.000 risposte, i sondaggisti effettuano più di 20.000 chiamate(2), talvolta accusando il “bias di risposta non partigiana”: un fenomeno per cui i risultati di studi sociologici diventano non rappresentativi perché i partecipanti possiedono in modo sproporzionato determinate caratteristiche che invalidano il risultato dell’indagine, siano queste politiche o demografiche. Nel contesto delle Presidenziali statunitensi, i Repubblicani risultano meno inclini dei Democratici a partecipare ai sondaggi, complice il calo di fiducia tra i conservatori nelle organizzazioni giornalistiche e nelle stesse agenzie di indagine statistica. Specularmente, gli elettori più inclini a compilare i sondaggi online sarebbero i giovani democratici, come riportato dal sondaggista James Johnson al Times of London.
Un’altra sfida significativa consiste nel prevedere chi, tra gli individui selezionati, manterrà la propria parola presentandosi al seggio, tenendo a mente che circa un terzo dei cittadini statunitensi idonei non vota e che gli individui presi in considerazione potrebbero mostrare il bias di risposta per desiderabilità sociale: un fenomeno per cui gli intervistati che non voteranno affermano il contrario, ritenendo la risposta accondiscendente più socialmente accettabile; per gli stessi motivi, rilasciano dichiarazioni false su chi hanno votato alle elezioni precedenti. In questo caso, la desiderabilità sociale peggiora l’accuratezza già precaria del metodo di ponderazione del “voto di richiamo”, ovvero l’integrazione alle risposte degli intervistati delle preferenze elettorali che questi hanno espresso quattro anni prima. Anche nell’ipotesi idealistica di poter ottenere la massima onestà dalle dichiarazioni dei membri del campione, la morfologia generale dell’elettorato di un partito e dell’altro evolve significativamente da un’elezione all’altra: gli elettori deceduti vengono sostituiti dai giovanissimi, spesso difficili da quantificare; inoltre, nel contesto di una Federazione di Stati come gli Stati Uniti d’America, molti cittadini migrano internamente, cambiando, talvolta in modo imprevedibile, gli equilibri assodati nella distribuzione geografica delle preferenze, anche dove queste sono storicamente più omogenee(3). Lo sforzo dei sondaggisti è duplice: non solo è fondamentale includere nei campioni percentuali realistiche per ciascuna categoria di elettori: è cruciale individuare gli “elettori giusti”.