自分も少し混乱してきたのですが、もしかしてサンプルサイズと回答率の概念を混同していませんか?
まず、良いパラメータ推定(つまり、,
第二に、サンプリング自体が、あなたが知っていることと真の母集団の値との間に不確実性の要素をもたらすのに対し、調査の回答率 <100% は、不確実性の別の要素をもたらします。
したがって、30万人の人口では、例えば300のサンプルサイズ(私はここで頭で考え、これを調べていません…すみませんか)が、母集団の値の推定に必要な精度を得るために十分かもしれません。 N=1000としましょう。これは多くの目的にはかなり大きいです。
そして今、回答率が40%だと仮定しましょう。 そこで、1000 件のアンケートを送信し (純粋にランダムとします)、400 件しか返送されなかったとします。 400 はそれ自体かなり良いサンプル サイズですが、この文脈では、今問題になっています。そもそも 400 人をランダムにサンプリングしていれば (そして全員が回答していれば)、集団で何が起こっているかについての偏りのない推定値が得られるはずです。 しかし、今あるのは、1,000人のサンプルの中から非ランダムに選ばれた400人なのです。 あなたが知っていることと、サンプルに含まれるべきものの間にある非ランダムな要因が問題なのです(母集団からのサンプリングによるランダムな要因ではありません)。 その非ランダム性はおそらくバイアスです。しかし、それがどのようなバイアスであるかを知ることさえおそらくできないので、最悪の種類です(出版されようとしているならば、必死に推測することはできますが)。 米国の元政府高官の言葉を借りれば、それは “未知の未知 “なのです。
私があまり研究していない世界に踏み込むと、調査研究のさまざまな不完全な回答率によって発生した可能性のあるバイアスを推定する方法があると思いますが、私の推測では、回答率が 100%を下回ると、潜在的バイアスの量はかなり速く増加すると思います。