Je tends à utiliser les critères d'alerte de "plausibilité biologique" de l'OMS avec les données anthropométriques. Ceux-ci sont très similaires aux anciens critères d'alerte qui étaient du CDC/NCHS.
On m'a demandé (pour deux projets distincts) d'appliquer à la fois les critères d'alerte de l'OMS et les critères d'alerte SMART pour quelques très grands ensembles de données et d'examiner les conséquences de l'utilisation de chacun d'eux. Je suis inquiet de pouvoir le faire.
J'ai quelques questions sur les critères d'alerte utilisés dans les enquêtes SMART.
Le manuel SMART a:
"Dans le rapport de vraisemblance, le programme donnera la liste et interrogera toute valeur qui est de ± trois écarts-types de la moyenne de l'enquête. Après qu'un ou deux groupes aient été saisis, ou s'il y a eu une enquête précédente, il est utile d'entrer, dans la feuille de vue d'ensemble des variables, des limites comme ± trois écarts-types (ou 3 z-scores) de la moyenne lors de la saisie de données. Cela permet d'éliminer les erreurs potentielles le plus tôt possible lors de la saisie des données ". (p 83)
Ceci suggère qu'un signal pour le P/T (par exemple) serait déclenché si:
P/T = moyenne (P/T) - 3 * sd (P/T)
ou:
P/T = moyenne (P/T) + 3 * sd (P/T)
Ceci indique que l'échantillon ET est le critère d'alerte principal. Cette approche a beaucoup de sens si l'on présume qu'il y a une normalité de la distribution de l'indicateur (qui est une question distincte).
Plus tard, le manuel SMART a:
"La plupart des enfants avec des données mal mesurées donnent des valeurs qui sont au sein de la gamme plausible. L'inclusion de ces erreurs peut présumer de l'examen de l'écart-type, et d'autres vérifications statistiques sur les données. L'écart-type devrait être compris entre 0,8 et 1,2 z-score unités pour la P/T dans toutes les enquêtes bien menées (dans 80% des enquêtes l'écart type est entre 0,9 et 1,1 unités z-scores).
Les écarts-types augmentent quand la proportion des résultats erronés augmente dans la base de données;. cela a un effet très important sur la prévalence calculée de l'émaciation. Pour cette raison, si une valeur est plus susceptible d'être une erreur qu'une véritable mesure, elle devrait être retirée de l'analyse. Nous le faisons en prenant la moyenne des données du P/T comme point fixe pour décrire l'état de la population que nous sondons. Statistiquement environ 2,5 enfants sur 900 seront situés en dehors des limites de ± 3 unités z-score de la moyenne. Moins de 0,5 sur 1000 se situeront en dehors ± 3,5 unités z-scores de la moyenne. Cela constitue la base pour décider si une valeur est plus susceptible d'être une erreur qu'une véritable mesure. Le logiciel affichera la liste des enfants avec ces valeurs extrêmes dans la liste de contrôle de plausibilité ". (P 86)
Je trouve que cela crée la confusion. Les estimations du nombre-de-cas aux différentes valeurs citées dans ce paragraphe ne sont vraies que si l'échantillon ET (ou 'z') = 1. Pour ET (ou 'z') = 1 et Z-score moyen = -1 nous nous attendons à ce qu'environ 2,43 cas aient un z-score en dessous de -4 (qui est la moyenne - 3). Si l'échantillon est de 1,2 ET alors nous nous attendons à 11.18 pour un z-score en dessous de -4 (qui est la moyenne - 3). Je ne dirais pas que 11.18 est "environ 2,5" (il est d'environ 4,5 fois plus grand). Si nous utilisons l'ET de l'échantillon alors nous nous attendons à 2,43 cas.
Il me semble que le manuel SMART est confus (il me déroute!) à propos de l'utilisation de «l'écart-type" et "z". En suivant les nombres et en remontant dans le travail fait... le raisonnement avoir "environ 2,5 enfants sur 900 »nécessite que la méthode utilise l'ET de l'échantillon.
Plus tard dans le manuel SMART, nous avons:
"Comme il est expliqué dans la section sur les valeurs extrêmes, cela vous indique si il y a une erreur aléatoire importante dans les mesures. Si l'écart-type est élevé (plus de 1,2), il est probable qu'il y aura beaucoup de valeurs extrêmes et les valeurs de plus de ± 3 z-scores de la moyenne ». (p 87)
Cela ne peut être le cas que si l'ET de l'échantillon n'est pas utilisé et les critères d'alerte utilisent ET = 1 de sorte qu'une alerte pour (par exemple) P/T serait déclenchée si:
P/T = moyenne (P/T) - 3
ou:
P/T = moyenne (P/T) + 3
Je ne suis pas sûr que cette approche de repérage ait beaucoup de sens.
Le manuel SMART est contradictoire à ce sujet et je me retrouve confus.
Mes questions sont les suivantes:
(1) Pouvons nous utiliser:
P/T = moyenne (P/T) +/- 3 * et (P/T)
ou:
P/T = moyenne (P/T) + 3
(2) Si nous sommes amenés à utiliser:
P/T = moyenne (P/T) + 3
Quelle est la justification pour cela quand nous pouvons facilement obtenir l'écart type de l'échantillon (SD)? Pourquoi présumer une variance connue?
La première question devrait être assez facile à répondre. La deuxième pourrait être plus difficile.
Toute assistance sera reçue avec gratitude.