I det här inlägget vill vi diskutera några av våra vanligaste frågor om urval och genomförbarhet för projekt: Vilken urvalsstorlek är representativ? Hur många intervjuer rekommenderas för att få representativa resultat? Är panelerna tillräckligt stora för att täcka den urvalsstorlek som krävs?
VI börjar med en historia som faktiskt har blivit marknadsundersökningens grundläggande myt. För hundra år sedan började den amerikanska tidskriften The Literary Digest genomföra opinionsundersökningar bland sina tio miljoner läsare för att förutspå resultatet av presidentvalet. I fem på varandra följande val var deras förutsägelser helt korrekta tills de massivt misslyckades 1936, trots att de genomförde cirka 2,4 miljoner intervjuer bland sina läsare. Till deras förvåning kunde George Gallup förutsäga resultatet av detta val korrekt med “bara” 50 000 intervjuer.
Så vad hände? Literary Digests urval misslyckades, eftersom deras läsare inte var representativa för den allmänna befolkningen. De hade en annan åldersstruktur, en annan genomsnittlig inkomst – och uppenbarligen andra politiska preferenser. Gallup förstod tvärtom att representativitet inte så mycket handlar om urvalets storlek utan om urvalets rätta sammansättning. Han använde helt enkelt kvoter för att se till att alla grupper av människor var korrekt representerade i sitt urval. Denna banbrytande upptäckt var startpunkten för marknads- och opinionsundersökningar som vi känner dem idag.
För representativiteten är det inte storleken som är avgörande utan den rätta sammansättningen. Men är det rimligt? På 1960-talet gav A.C. Nielsen Jr. ett intressant svar till de som trodde att ett större urval skulle öka dess representativitet.
“Om du inte tror på slumpmässiga urval, nästa gång du tar ett blodprov, säg åt läkaren att ta allt.” – A.C. Nielsen Jr.
Trots sin obestridliga sarkasm ger detta citat oss en mycket begriplig analogi. Det spelar ingen roll om man analyserar en droppe blod eller om man tar en hel liter: analysresultaten kommer alltid att vara desamma. En droppe blod representerar allt detta på ett perfekt sätt.
Självklart är urvalsstorleken fortfarande viktig. Men varför spelar det egentligen någon roll? När man har ett representativt urval för en population kan det hända att några av målvariablerna är över- eller underrepresenterade i urvalet. Tyvärr innebär “slumpen” att det egentligen inte finns något du kan göra åt det när du samlar in data.
Statistiska beräkningar kan åtminstone hjälpa dig att uppskatta sannolikheten för att ditt fel ligger inom en viss marginal, t.ex. att sådana avvikelser från det verkliga värdet är mindre än x% vid en konfidensnivå på 95%.
Om man vill minska felmarginalen (givet en viss konfidensnivå) har man i princip bara ett val: man måste öka urvalsstorleken.
För att bestämma storleken på ditt urval är det ofta nödvändigt att börja från slutet och arbeta sig bakåt till början. För tydlighetens skull kommer vi dock att kortfattat gå igenom intervjuprocessen i rätt ordning och förklara de slutliga statusar som en respondent kan få.
Allt börjar med att vi skickar inbjudningar till våra panelmedlemmar. Av alla inbjudna är det bara en del som faktiskt klickar på länken och startar undersökningen. Det är vad vi beskriver med svarsfrekvensen (procentandelen svar i förhållande till det totala antalet inbjudningar att delta). I början av en undersökning brukar vi dessutom ha några screeningfrågor för att identifiera den önskade målgruppen. Procentandelen behöriga respondenter i detta skede återspeglas i incidensen (procentandelen individer i en målpopulation som uppfyller ett specifikt kriterium som krävs för en studie). När vi har säkerställt att vi har rätt målgrupp kommer vi att bedöma möjliga kvoter och avsluta intervjun för de respondenter vars kvoter redan har fyllts. Kvoter utvärderas vanligtvis efter screeningen för att se till att vi kan mäta rätt incidens utan inblandning av kvoter. Om respondenterna passar in i en öppen kvot kan de delta i huvudundersökningen. Vissa kan dock avbryta under intervjun och aldrig nå slutsidan. Slutligen kommer de som når slutet av undersökningen att räknas som slutförda intervjuer.
Som tidigare nämnts börjar processen för att fastställa genomförbarhet med det nödvändiga antalet genomförda intervjuer och sedan arbetar man bakåt för att beräkna det nödvändiga antalet inbjudningar. Låt oss säga att vi genomför en studie som kräver totalt 1 000 intervjuer. Det första steget är att uppskatta antalet ofullständiga under huvudintervjun (även kallat “drop outs”, “partials” eller “abandonments”).
Så vad är ett rimligt antagande för frekvensen av ofullständiga? Det beror huvudsakligen på själva undersökningen. Om frågeformuläret är långt, repetitivt eller handlar om ett ämne som inte är så relevant för respondenterna kan fler ofullständiga förväntas. Men även tekniken spelar en viktig roll. Om undersökningen bygger på föråldrad teknik (t.ex. Flash) eller inte är mobilvänlig (t.ex. responsiv), kan användarna ha svårt att fylla i undersökningen. Våra erfarna projektledare hjälper dig gärna att optimera ditt frågeformulär för att hålla antalet ofullständiga så lågt som möjligt!
Om vi antar ett bortfall på 2 % i vårt exempel innebär det att vi behöver 1 020 respondenter för att starta huvudintervjun.
Nästa steg är att uppskatta mängden kvotbortfall, vilket ofta är den mest utmanande uppgiften och kräver en erfaren projektledare.
Kvotdefinitioner kan vara ganska komplexa. De kan innehålla många variabler, de kan vara sammankopplade eller icke sammankopplade och ibland tilldelas respondenterna dem till och med av en slump (tänk på monadiska test). I teorin ska de tillgängliga variablerna i våra panelmedlemmars profiler hjälpa oss att bjuda in endast de rätta deltagarna och undvika kvotbortfall. Detta är dock inte alltid möjligt i praktiken. Vi kanske inte alltid har tillgång till alla de profiler som krävs, och om fältperioden är för kort kanske vi inte har möjlighet att gradvis och noggrant uppfylla de olika kvoterna.
Sammanfattningsvis är kvotbortfall nästan oundvikliga i de flesta fall. Deras omfattning beror mycket på specifikationerna för studien (t.ex. kvotplan, fältperiod), men också på projektledarens erfarenhet. Att lyckas uppfylla alla krav inom tidsramen och samtidigt behålla panelen kan utgöra en betydande utmaning, och det skiljer erfarna provtagare från oerfarna.
Låt oss anta att 20 % av kvoterna inte uppfylls i vårt exempel, så att vi behöver 1 276 screenade respondenter, inklusive break-offs.
Det är relativt enkelt att uppskatta antalet screen outs, eftersom incidensen vanligtvis är en del av förslaget. Denna incidens bör helst motsvara den andel av de svarande som klarar sig genom screeningen och är vanligtvis oberoende av andra faktorer.
Låt oss anta en incidens på 50 % för vårt exempel, vilket ger oss ett behov av 2 552 påbörjade.
Det sista steget i vår beräkning är ett svar på frågan om hur många medlemmar vi måste bjuda in för att få 2 552 påbörjade. Svarsfrekvensen beror i viss mån på externa faktorer (t.ex. dagtid, veckodag, väder, semesterperiod osv.). Dessutom spelar panelens kvalitet en roll, och sist men inte minst parametrarna för själva studien: om undersökningen är lämplig för mobila enheter kan vi skicka inbjudan till vår panelapp och därigenom öka svarsfrekvensen.
Om vi säger att det är 45 % i vårt exempel, skulle vi behöva en total urvalsstorlek på 5 669. Det är den minsta mängd som krävs för att uppfylla specifikationerna i denna exempelstudie. Men som du kan se i vår panelbok är även vår minsta onlinepanel tillräckligt stor för att genomföra den här typen av studier.
Och detta leder oss till en mycket viktig affärsfråga: Hur bra är tillräckligt bra? Det finns definitivt inget generellt svar på frågan, men vi skulle vilja diskutera tre scenarier för att illustrera möjliga sätt att tänka kring den:
I slutändan består konsten i att ha tillräckligt många intervjuer som gör att du kan dra tillförlitliga slutsatser och ändå vara rimlig med de totala kostnaderna för fältarbetet.
Så hur många intervjuer rekommenderas för att få representativa resultat? Denna fråga kan helt enkelt inte besvaras. Man kan ha små urval som är mycket representativa och stora urval som inte alls är representativa (mycket ofta: “Big Data”).