Yo también me estoy confundiendo un poco, pero quizás has confundido los conceptos de tamaño de muestra y tasa de respuesta. No son lo mismo.

En primer lugar, NO se necesita una muestra de 30.000 para obtener buenas estimaciones de los parámetros (es decir, En segundo lugar, mientras que el muestreo en sí mismo introduce un elemento de incertidumbre entre lo que se sabe y los verdaderos valores de la población, una tasa de respuesta a la encuesta <100% introduce otro elemento de incertidumbre.

Así que con una población de 300.000 un tamaño de muestra de, digamos, 300 (estoy pensando en esto, no lo estoy buscando… lo siento…) podría ser suficiente para obtener la precisión que se necesita en la estimación de los valores de la población. O quizás necesite más; digamos que N=1000, que es bastante grande para muchos propósitos.

Y ahora supongamos que obtiene una tasa de respuesta del 40%. Así que envías 1.000 encuestas (digamos que puramente al azar) y sólo recibes 400 de vuelta. 400 es un tamaño de muestra bastante bueno en sí mismo, pero en este contexto resulta problemático: si hubiera tomado una muestra aleatoria de 400 individuos en primer lugar (y todos hubieran respondido), tendría estimaciones no sesgadas de lo que ocurre en la población. Sin embargo, lo que tiene ahora son 400 individuos seleccionados de forma no aleatoria de una muestra de 1.000. Ese factor no aleatorio que se interpone entre lo que se sabe y lo que debería haber en la muestra es el problema (no el factor aleatorio del muestreo de la población). Ese factor no aleatorio es un sesgo, probablemente, pero es el peor tipo de sesgo, porque probablemente ni siquiera se puede saber qué tipo de sesgo es (aunque se puede intentar adivinar con mucho esfuerzo, si se intenta publicar). En palabras de un antiguo funcionario estadounidense, es una «incógnita desconocida». Así que ahora, todas las estimaciones de los parámetros no sólo son inciertas, sino que muy probablemente sean inexactas en una dirección concreta, pero no se sabe en qué dirección ni en cuánto se han desviado.

Adentrándome en un mundo que no he estudiado mucho, creo que hay formas de estimar la cantidad de sesgo en que podrían haber incurrido varias tasas de respuesta imperfectas para los estudios de encuestas, pero mi suposición es que la cantidad de sesgo potencial crece bastante rápido a medida que la tasa de respuesta cae por debajo del 100%.

Articles

Deja una respuesta

Tu dirección de correo electrónico no será publicada.