Olen itsekin hieman hämmentynyt, mutta ehkä olet sekoittanut otoskoon ja vastausprosentin käsitteet? Ne eivät ole sama asia.
Ensiksi, et tarvitse 30 000:n otosta hyviin parametriestimaatteihin (ts, estimaatteja populaation ominaisuuksista), jos otanta on hyvä.
Toiseksi, jos otanta itsessään tuo epävarmuutta sen välille, mitä tiedämme ja mitkä ovat todelliset populaation arvot, kyselytutkimuksen vastausprosentti <100% tuo toisen epävarmuuden elementin.
Siten 300 000:n populaation kohdalla näytekoko, vaikkapa 300 (menen ihan ylhäältä alaspäin, en etsi tätä… anteeksi…anteeksi…?), saattaa riittää, jos haluatte tarvittavan tarkkuuden populaatiossa esiintyvien arvojen estimoinnissa. Tai ehkä tarvitset enemmän; sanotaan vaikka N=1000, mikä on aika suuri moniin tarkoituksiin.
Ja nyt oletetaan, että vastausprosentti on 40 %. Lähetät siis 1000 kyselyä (vaikkapa puhtaasti satunnaisesti) ja saat takaisin vain 400 kyselyä. 400 on sinänsä aika hyvä otoskoko, mutta tässä yhteydessä se on nyt ongelmallinen: jos olisit ottanut alunperin vain satunnaisesti 400 yksilöä (ja he kaikki olisivat vastanneet), sinulla olisi puolueettomia arvioita siitä, mitä populaatiossa tapahtuu. Nyt sinulla on kuitenkin 400 yksilöä, jotka on valittu ei-sattumanvaraisesti 1000 yksilön otoksesta. Tämä ei-sattumanvarainen tekijä, joka on ongelmana sen välillä, mitä tiedätte ja mitä otoksessanne olisi pitänyt olla, on ongelma (ei perusjoukosta poimitun otoksen satunnaistekijä). Tuo ei-sattumanvaraisuus on luultavasti harhaa – mutta se on pahinta mahdollista, koska et luultavasti voi edes tietää, millaista harhaa se on (vaikka voitkin yrittää kovasti arvailla, jos yrität saada julkaisua). Erään Yhdysvaltain entisen virkamiehen sanoin se on ”tuntematon tuntematon”. Joten nyt kaikki parametriestimaattisi eivät ole vain epävarmoja, vaan ne ovat todennäköisesti epätarkkoja johonkin tiettyyn suuntaan, mutta et tiedä, mihin suuntaan se on tai kuinka paljon ne ovat väärässä.
Maailmassa, jota en ole tutkinut kovinkaan paljon, uskon, että on olemassa tapoja arvioida, kuinka paljon harhaa kyselytutkimusten erilaiset epätäydelliset vastausprosentit ovat saattaneet aiheuttaa, mutta arvaukseni on, että potentiaalisen harhapotentiaalin suuruus kasvaa melko nopeasti vastausprosentin laskiessa alle 100 %:n.