Échantillonnage et estimation pour le bio-médical/Échantillonnage
Modèle:Chapitre les paramètres de la population sont supposés connus.
On étudie un caractère pour lequel la moyenne de la population est et son écart type est .
Soit donc , une variable aléatoire définie sur la population qui prend pour valeur le caractère étudié.
On a donc:
De la population, on extrait des échantillons de taille (contenant individus).
Étude de la moyenne d'un échantillon
Sur l'ensemble des échantillons, on peut définir une nouvelle variable aléatoire appelée moyenne aléatoire de l'échantillon qui prend pour valeur les moyennes des valeurs du caractère sur chaque échantillon.
Il est évident que la moyenne des valeurs du caractère n'est pas la même sur chaque échantillon car les tirages se font au hasard. On appelle cela les fluctuations de l'échantillonnage.
Nous sommes dans les conditions d'application du théorème de la limite centrale.
Lorsque est suffisamment grand, on peut dire que:
suit une loi normale centrée réduite.
On considérera que ceci est vrai pour .
On peut en déduire que:
Si l'effectif de l'échantillon est supérieur à 30. La variable suit une loi normale de moyenne et d'écart-type .
On retiendra:
Étude de la variance d'un échantillon
On notera la variable aléatoire qui prend pour valeur les variances des échantillons extraits de la population.
On notera la variable aléatoire qui prend pour valeur les écarts-types des échantillons. On a déjà:
On démontre et nous admettrons que :
Étude de la fréquence d'un caractère dans un échantillon
Un élément d'une population peux avoir une propriété avec une certaine fréquence.
Par exemple, un bébé sur 8 né prématuré. La fréquence serait alors de 12,5 %.
Si la population est grande, on peut assimiler la fréquence à une probabilité .
Un bébé pris au hasard a une probabilité d'être né prématurément.
On peut être amené à étudier la fréquence sur un échantillon extrait de la population.
On notera la variable aléatoire qui prend pour valeur la fréquence observée sur des échantillons de taille extrait de la population.
On Montre et nous admettrons que:
D'autre part si , on peut dire que suit une loi normale de moyenne et d'écart-type .
Si les formules ci-dessus sont toujours vraies mais ne suis plus une loi normale.
Pour calculer des intervalles de fluctuation, on utilise alors des abaques.