Je suis moi-même un peu confus, mais peut-être avez-vous confondu les concepts de taille d’échantillon et de taux de réponse ? Ce ne sont pas les mêmes.

Premièrement, vous n’avez PAS besoin d’un échantillon de 30 000 pour obtenir de bonnes estimations des paramètres (c’est-à-dire, estimations des caractéristiques de la population) si vous avez un bon échantillonnage.

Deuxièmement, où l’échantillonnage lui-même introduit un élément d’incertitude entre ce que vous savez et ce que sont les vraies valeurs de la population, un taux de réponse à l’enquête <100% introduit un autre élément d’incertitude.

Donc, avec une population de 300 000 personnes, une taille d’échantillon de, disons, 300 (je vais tout en haut de ma tête ici, sans chercher… désolé ?) pourrait être suffisante pour obtenir la précision dont vous avez besoin dans l’estimation des valeurs de la population. Ou peut-être avez-vous besoin de plus ; disons N=1000, ce qui est assez grand pour de nombreux objectifs.

Et maintenant, supposons que vous obteniez un taux de réponse de 40%. Vous envoyez donc 1 000 enquêtes (disons de manière purement aléatoire) et n’obtenez que 400 réponses. 400 est une assez bonne taille d’échantillon en soi, mais dans ce contexte, c’est maintenant problématique : si vous aviez juste échantillonné au hasard 400 individus en premier lieu (et qu’ils avaient tous répondu), vous auriez des estimations impartiales de ce qui se passe dans la population. Cependant, vous avez maintenant 400 individus sélectionnés de manière non aléatoire dans un échantillon de 1 000 personnes. Le problème réside dans le facteur non aléatoire qui se situe entre ce que vous savez et ce qui aurait dû se trouver dans votre échantillon (et non dans le facteur aléatoire de l’échantillonnage de la population). Ce caractère non aléatoire est probablement un biais – mais c’est le pire, car vous ne pouvez probablement même pas savoir de quel type de biais il s’agit (bien que vous puissiez essayer de le deviner, si vous essayez d’être publié). Pour reprendre les termes d’un ancien fonctionnaire américain, c’est un « inconnu inconnu ». Donc maintenant, toutes vos estimations de paramètres ne sont pas seulement incertaines, elles sont très probablement inexactes dans une direction particulière, mais vous ne savez pas quelle direction c’est ou de combien elles sont erronées.

S’aventurant dans un monde que je n’ai pas beaucoup étudié, je crois qu’il existe des moyens d’estimer combien de biais pourraient avoir été encourus par divers taux de réponse imparfaits pour les études d’enquête, mais ma supposition est que la quantité de biais potentiel croît assez rapidement lorsque le taux de réponse tombe en dessous de 100 %.

Articles

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.