Première nous déballons le terme «bloc de bootstrap pondérée". Le "bloc" et des parties pondérés se réfèrent à la façon dont une réplique bootstrap (un «pseudo-enquête" créés par ré les données réelles) est créé. Pour le travail d'enquête de cette réplique de la méthode d'échantillonnage. Avec une enquête de type SMART, nous avons utilisé une méthode bloqué et l'échantillon répété est pris comme échantillon avec remplacement des grappes, puis un échantillon avec remplacement à partir avec le cluster. Il est sur la pondération parce qu'une enquête SMART utilise PPS au poids avant l'échantillon. Pour un échantillon de RAM ou S3M (les deux utilisent un échantillonnage spatial) les répétitions est faite par échantillonnage clusters avec remplacement et proportionnelle à la taille des populations.
Vous remettez en question est plus sur la partie «bootstrap» du terme. la méthode est très simple. Utilisation de votre exemple:
(1) Prendre r = 500 réplique à partir de l'enquête de référence. Calculer la prévalence dans chaque répétitions. Cela vous donnera R = 500 prévalences de base. Appelons cette BP.
(2) Prendre r = 500 répliques de l'enquête de fin d'étude. Calculer la prévalence dans chaque répétitions. Cela vous donnera R = 500 prévalences de fin d'étude. Appelons cet EP.
(3) Vous êtes intéressé par la différence entre la ligne de base et la prévalence ligne de fond. Nous pouvons estimer ce en soustrayant les prévalences répliquer à partir de l'autre:
Répliquer BP EP Différence (BP - EP)
------------ ----- ----- --------------------
0,121 0,105 0,016 1
0,133 0,114 0,019 2
3 0,125 0,129 -0,004
4 0,091 0,113 -0,022
. . . .
. . . .
. . . .
0,120 0,112 0,008 500
------------ ----- ----- --------------------
(4) Il ya deux façons de procéder d'ici. Si vous êtes intéressé à estimer l'ampleur de la différence ensuite trouver la différence MEDIAN (ce qui est l'estimation ponctuelle de la différence) et le 2,5e percentile et le percentile 97,5 (ce sont les limites de confiance inférieure et supérieure de 95% de la différence ). Si l'intervalle de confiance contient zéro, alors vous pourriez conclure qu'il n'y a pas de différence significative. Si vous voulez une valeur p puis de compter le nombre de différences qui sont inférieures ou égales à zéro et diviser par le nombre de répétitions. Si (par exemple), il y avait 11 différences <= 0 et 500 répétitions alors p = 11/500 = 0,0220.
Je présente ici un exemple codé en R d'un exemple bootstrap norme relative au gain de poids en deux groupes de porcs sur différents compléments alimentaires:
#
# Les gains de poids sur les deux régimes
#
diet1 <- c (31, 34, 29, 26, 32, 35, 38, 34, 31, 29, 32, 31)
diet2 <- c (26, 24, 28, 29, 30, 29, 31, 29, 32, 26, 28, 32)
#
# Accumulateur pour les différences
#
différences <- NULL
#
# Prenez 500 répliques
#
pour (i à 1: 500)
{
#
# Répétés sont des gains de poids moyen sur chaque régime
#
r1 <- moyenne (échantillon (diet1, replace = TRUE))
r2 <- moyenne (échantillon (diet2, replace = TRUE))
#
# Différences
#
différences <- c (différences, R1 - R2)
}
#
# Estimations
#
quantile (différences, probs = c (0,5, 0,025, 0,975))
#
# Une valeur p
#
z <- IfElse différences (<= 0, 1, 0)
somme (z) / 500
Quand je lance ce je me suis différence = 3,17 (IC à 95% = 1,08; 5,58) avec p = 0,0020. Des résultats similaires peuvent être obtenus en utilisant un test t simple.
Vous pouvez vous demander "Pourquoi utiliser le bootstrap?" ... Plusieurs réponses:
(1) Il est très efficace taille de l'échantillon de WRT.
(2) Il est (sous la forme donnée ci-dessus) non-paramétrique utilisant empiriques plutôt que des distributions théoriques. Il n'y a pas d'hypothèses (par exemple) la normalité de violer.
(3) Nous pouvons utiliser toute statistique nous voulons. Il est (par exemple) ne classique des tests des différences dans les valeurs médianes. Pour le bootstrap ci-dessus, nous pouvons le faire en remplaçant «moyenne» avec «médiane». Nous aurions pu facilement regardé gain de poids total en remplaçant "signifie" avec "somme". Essai classique sont limitées à quelques statistiques.
(4) Ce que vous voyez ci-dessus est aussi compliqué qu'il obtient. Essai classique peut devenir compliqué assez rapidement.
Quoi qu'il en soit ... Je espère que cette aide.