Jeg bliver selv lidt forvirret, men måske har du forvekslet begreberne stikprøvestørrelse og svarprocent? De er ikke det samme.

For det første behøver du IKKE en stikprøve på 30.000 for at få gode parameterestimater (dvs, estimater af populationens karakteristika), hvis man har en god stikprøve.

For det andet, hvor stikprøveudtagning i sig selv introducerer et element af usikkerhed mellem det, man ved, og hvad de sande populationsværdier er, introducerer en svarprocent på <100% endnu et element af usikkerhed.

Så med en population på 300.000 kan en stikprøvestørrelse på, lad os sige, 300 (jeg går helt op i hovedet her, jeg slår det ikke op… undskyld?) være rigeligt til at få den præcision, man har brug for i estimater af populationsværdier. Eller måske har du brug for mere; lad os sige N=1000, hvilket er ret stort til mange formål.

Og lad os nu antage, at du får en svarprocent på 40%. Så du sender 1.000 undersøgelser ud (lad os sige rent tilfældigt) og får kun 400 tilbage. 400 er i sig selv en ret god stikprøvestørrelse, men i denne sammenhæng er det nu problematisk: Hvis du bare havde udtaget en tilfældig stikprøve af 400 personer i første omgang (og de alle havde svaret), ville du have uvildige skøn over, hvad der foregår i befolkningen. Men nu har du 400 personer, der er udvalgt tilfældigt fra en stikprøve på 1.000 personer. Det er denne ikke tilfældige faktor, der står mellem det, du ved, og det, der skulle have været i din stikprøve, der er problemet (ikke den tilfældige faktor ved udtagning af stikprøver fra populationen). Denne ikke-tilfældighed er sandsynligvis bias – men det er den værste slags, fordi du sandsynligvis ikke engang kan vide, hvilken slags bias det er (selv om du kan forsøge virkelig hårdt at gætte, hvis du forsøger at blive publiceret). Med en tidligere amerikansk embedsmands ord er det en “ukendt ukendt”. Så nu er alle dine parameterestimater ikke blot usikre, de er højst sandsynligt unøjagtige i en bestemt retning, men du ved ikke, hvilken retning det er, eller hvor meget de er afvigende.

I en verden, som jeg ikke har studeret meget, tror jeg, at der er måder at estimere, hvor meget bias der kan være opstået som følge af forskellige ufuldkomne svarprocenter for undersøgelsesundersøgelser, men mit gæt er, at mængden af potentiel bias vokser ret hurtigt, når svarprocenten falder til under 100 %.

Articles

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.