Cher Nick:
Vous avez posé une bonne question. L'échantillonnage stratifié est souvent fait en utilisant des strates géographiques afin de minimiser la taille de l'échantillon nécessaire pour faire des estimations raisonnablement précises des résultats dans chaque subdivision géographique; Par exemple, dans chaque province ou région. Cependant, une autre raison de faire l'échantillonnage stratifié est d'augmenter la précision obtenue dans votre échantillon. Si l'échantillon est stratifié sur une variable qui est associée avec le résultat, en tenant compte de la stratification au cours de l'analyse des données se traduira par une meilleure précision que ce qui serait obtenu avec un échantillon non stratifié de la même taille.
Ma question est: Pourquoi stratifier votre échantillon? Si vous mesurez l'efficacité des deux interventions différentes (cash et cash plus CCC) contre le contrôle. vous n'êtes pas tenter d'évaluer les résultats dans chaque strate. Si vous faites la stratification pour obtenir une meilleure précision, alors vous devez stratifier seulement les facteurs que vous connaissez seront associés aux résultats que vous mesurez. La stratification sur des facteurs non associés à votre résultat est une perte de temps et de ressources.
Mais il y a des coûts et des problèmes avec la stratification. Tout d'abord, pour tenir compte de la stratification lorsque l'on compare la variable de résultat dans chaque groupe d'intervention, vous aurez besoin de faire une analyse stratifiée ou plusieurs variables qui complique grandement l'analyse de données. Deuxièmement, vous devez disposer de données sur toutes les variables de stratification pour chaque unité d'échantillonnage. Toute unité d'échantillonnage sans données complètes sur toutes les variables de stratification ne peut pas être inclus dans l'échantillon, car vous ne serez pas en mesure de le placer dans une strate. Troisièmement, si vous stratifier sur trop de variables, le nombre d'unités d'échantillonnage dans chaque strate peut devenir tout petit. La strate est définie comme l'ensemble des valeurs pour toutes les variables de stratification. Par exemple, si vous stratifier le quintile de richesse (5 valeurs possibles), l'approvisionnement en eau potable (2 valeurs possibles), un assainissement adéquat (2 valeurs possibles), et 3 niveaux différents de prévalence de la maladie (3 valeurs possibles), vous aurez 60 strates ( 5 x 2 x 2 x 3). Cela conduira à de très petits nombres dans chaque strate qui ne soit pas une bonne idée.
Donc, en bref, si vous souhaitez améliorer la précision de votre étude, je voudrais choisir 1 ou 2 variables que vous jugez les plus fortement liés à un retard de croissance et stratifier sur eux, si vous avez les données nécessaires.