Hoe groot moet de steekproef zijn?
Er is geen eenduidig getal dat altijd klopt. In praktische testopzetten voor scheerapparaten hanteer je dit als richtlijn: 30–50 deelnemers per product om matige verschillen te vinden; 100 of meer per product als je kleine verschillen of veel variatie verwacht. Die aantallen gelden wanneer je onafhankelijke groepen gebruikt. Kies voor een crossover-ontwerp (iedere deelnemer test meerdere apparaten) als je individuele verschillen wilt beperken: dat verlaagt de benodigde steekproef omdat elke proefpersoon zijn eigen controle is.
Welke statistische keuzes bepalen de steekproefgrootte?
Drie zaken bepalen de grootte:
- Gewenste power (meestal 80–90%): de kans om een werkelijk verschil te vinden.
- Significantieniveau (meestal 5%): hoe streng je bent tegen toeval.
- Effectgrootte en variantie: hoe groot het verschil moet zijn om praktisch relevant te zijn, en hoe groot de onderlinge verschillen tussen gebruikers zijn.
Voer een powerberekening uit met deze drie waarden. Als je niet precies weet hoe groot de variantie is, maak dan een conservatieve inschatting of voer een kleine pilot uit (20–30 deelnemers) om variantie te schatten en de berekening bij te stellen.
Welke uitkomstmaten moet je gebruiken?
Kies meetpunten die zowel objectief als relevant zijn voor de eindgebruiker. Voor scheerapparaten zijn dat bijvoorbeeld:
- Scheerresultaat (visuele of gestandaardiseerde score van haardichtheid of gladheid).
- Huidreactie (geïntegreerde score voor roodheid, irritatie, instuikingen).
- Gebruiksgemak en comfort (gestandaardiseerde vragenlijst).
- Batterijprestatie en operationele tijd tijdens gebruik.
Gebruik objectieve metingen waar mogelijk en combineer met gevalideerde vragenlijsten. Meet batterijen of continue prestaties aan de hand van de daadwerkelijke gebruikstijd: bijvoorbeeld vergelijk apparaten waarvan bekend is dat de accu 90 minuten versus 100 minuten houdt om te zien of de praktijkverschillen significant zijn.
Ontwerpadvies: parallel, crossover en stratificatie
Voor scheerapparaten verdient een gerandomiseerd crossover-ontwerp vaak de voorkeur: elke deelnemer test meerdere apparaten in willekeurige volgorde met voldoende herstelperiode tussen tests. Dit reduceert subjectvariatie en verlaagt benodigde aantallen. Gebruik stratificatie op relevante kenmerken (bijvoorbeeld type baardgroei of gevoelige huid) als die kenmerken invloed hebben op uitkomsten.
Als een crossover onpraktisch is (bijv. lange gebruiksperioden), kies je gerandomiseerde parallelgroepen, maar plan dan grotere steekproeven en controleer baseline-kenmerken zorgvuldig.
Praktische testopzet en productkeuze
Praktische punten om rekening mee te houden bij uitvoering en productselectie:
- Test batterijkritische eigenschappen met apparaten die verschillende batterijduur hebben: gebruik bijvoorbeeld de Skull Master Pro die het 100 minuten volhoudt en de Pro Skull Shaver die 90 minuten doorloopt om batterijimpact te evalueren.
- Vergelijk instelbare modellen voor precisie- en lengtetesten: de Zeri heeft instelbare scheerstanden en is daardoor geschikt om variatie door standen te kwantificeren.
- Plan voldoende proefpersonen per stratum (bijv. lichte versus zware baardgroei) zodat je betrouwbare uitspraken kunt doen binnen die groepen.
Concreet: start met een pilot van 20–30 deelnemers om variantie te meten, voer daarna een powerberekening uit en kies 30–50 deelnemers per product voor matige verschillen of 100+ wanneer je zoekt naar subtiele verbeteringen.