Sono un po’ confuso anch’io, ma forse hai confuso i concetti di dimensione del campione e tasso di risposta? Non sono la stessa cosa.

In primo luogo, NON avete bisogno di un campione di 30.000 per una buona stima dei parametri (cioè, stime delle caratteristiche della popolazione) se avete un buon campionamento.

In secondo luogo, dove il campionamento stesso introduce un elemento di incertezza tra ciò che sapete e i veri valori della popolazione, un tasso di risposta al sondaggio <100% introduce un altro elemento di incertezza.

Quindi con una popolazione di 300.000 una dimensione del campione di, diciamo, 300 (sto andando a capo della mia testa qui, non cercando questo… scusa?) potrebbe essere sufficiente per ottenere la precisione necessaria nella stima dei valori della popolazione. O forse hai bisogno di più; diciamo N=1000, che è abbastanza grande per molti scopi.

E ora supponiamo che tu ottenga un tasso di risposta del 40%. Quindi invii 1000 sondaggi (diciamo in modo puramente casuale) e ne ricevi solo 400. 400 è una dimensione del campione abbastanza buona di per sé, ma in questo contesto è ora problematica: se aveste campionato a caso 400 individui in primo luogo (e tutti avessero risposto), avreste stime imparziali di ciò che sta accadendo nella popolazione. Tuttavia, quello che avete ora sono 400 individui selezionati non casualmente da un campione di 1.000. Quel fattore non casuale che si frappone tra ciò che sapete e ciò che avrebbe dovuto essere nel vostro campione è il problema (non il fattore casuale del campionamento dalla popolazione). Questa non casualità è un pregiudizio, probabilmente – ma è il tipo peggiore, perché probabilmente non potete nemmeno sapere che tipo di pregiudizio è (anche se potete provare a indovinare, se state cercando di essere pubblicati). Nelle parole di un ex funzionario degli Stati Uniti, è una “incognita sconosciuta”. Così ora, tutte le vostre stime dei parametri non sono solo incerte, sono molto probabilmente imprecise in una particolare direzione, ma non sapete quale sia questa direzione o di quanto siano sbagliate.

Venturando in un mondo che non ho studiato molto, credo che ci siano modi per stimare quanto bias potrebbe essere stato sostenuto da vari tassi di risposta imperfetti per gli studi di indagine, ma la mia ipotesi è che la quantità di bias potenziale cresce abbastanza velocemente come il tasso di risposta scende sotto il 100%.

Articles

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.