Initiation à la statistique/Médiane

De testwiki
Aller à la navigation Aller à la recherche

Modèle:Chapitre


Les statistiques sont le domaine des mathématiques dont le but est d’organiser de grandes masses de données pour les utiliser et les interpréter.

Elles sont utiles dans les sciences (notamment humaines : économie, sociologie, démographie…) et dans des domaines appliqués : commerce, médecine…


Exemple 1 : Les notes des élèves d’une classe à un devoir

Les élèves d’une classe ont obtenu les notes suivantes à un devoir :

Notes sur 20  : 10, 9, 12, 11, 10, 8, 14 ,11 ,9 ,16 ,5 ,12 ,10 ,11 ,10 ,13

On présente les résultats de l’enquête sous forme d’un tableau d’effectifs.

Moyenne

Tableau des effectifs et moyenne

L’effectif d’une valeur est le nombre de fois où cette valeur apparaît.

notes 5 8 9 10 11 12 13 14 16 Total
effectifs 1 1 2 4 3 2 1 1 1 16
Produit 5 8 18 40 33 24 13 14 16 171

Une première méthode permettant de calculer la moyenne de la classe, consiste tout d’abord à déterminer le total de points que totalise la classe car par définition la moyenne de la classe répond à la question suivante:

Si tous les élèves avaient eu la même note, quelle serait-elle pour que la classe totalise toujours ce même nombre de points ?

Pour calculer la note moyenne de la classe, on applique donc la formule suivante :

Total des notesEffectif total=17116=10,687510,7

Tableau des fréquences et moyenne

La fréquence de la note 10, par exemple, se calcule ainsi :

Effectif de la note 10Effectif total=416=0,25=25%

En procédant de même pour les autres notes, on obtient le tableau des fréquences (qu'on ne transforme pas en pourcentages pour calculer la moyenne) :

notes 5 8 9 10 11 12 13 14 16 Total
fréquences 0,0625 0,0625 0,125 0,25 0,1875 0,125 0,0625 0,0625 0,0625 1
Produit 0,3125 0,5 1,125 2,5 2,0625 1,5 0,8125 0,875 1 10,6875

On trouve ici la seconde méthode de calcul de la moyenne comme somme des produits des notes par leurs fréquences.

Médiane

Tableau des effectifs cumulés et médiane

Reprenons l'exemple 1 des notes des élèves :

notes 5 8 9 10 11 12 13 14 16
effectifs 1 1 2 4 3 2 1 1 1
effectifs cumulés 1 2 4 8 11 13 14 15 16


Modèle:Début cadre La médiane d’une série statistique quantitative est

la valeur du caractère qui partage l'effectif en deux parties égales.

Modèle:Fin cadre

Ici, on peut lire la médiane dans le tableau des effectifs ;

comme il y a 16 élèves, l'effectif se partage entre les 8 notes les plus basses

et les 8 notes les plus hautes.

La huitième note la plus haute est 11.

La huitième note la plus basse est 10.

On prendra la médiane entre les deux, soit 10,5

Tableau des fréquences cumulées

En procédant comme pour les effectifs cumulés, on peut construire

un tableau des fréquences cumulées,

par exemple avec l'exemple 1 des notes :

notes 5 8 9 10 11 12 13 14 16
fréquences en % 6,25 6,25 12,50 25,00 18,75 12,50 6,25 6,25 6,25
fréquences cumulées en % 6,25 12,5 25 50 68,75 81,25 87,5 93,75 100

Etendue

Modèle:Début cadre L'étendue d’une série statistique quantitative est l'écart entre sa plus grande valeur et sa plus petite valeur. Modèle:Fin cadre

Exemple 1 des notes

La note la plus élevée est 16, la note la plus basse est 5

L'étendue est donc :

165=11

Regroupement en classes : exemple 2 des salaires

Lorsque le caractère statistique peut prendre un grand nombre de valeurs différentes, on les regroupe en classes (ou intervalles, ou tranches …).

En troisième, on travaille avec des classes de même largeur.

Tableaux et moyenne

Répartition des revenus annuels en milliers d’euros dans une population de 4370 personnes.

Modèle:Début cadre Quand on regroupe une série statistique en classe, on calcule la moyenne en prenant comme valeurs les centres de chaque classe. Modèle:Fin cadre

On a regroupé dans le même tableau les effectifs et les fréquences ainsi que les centres des classes.

Salaires (en milliers d'euros) entre 5 (inclus) et 10 exclus entre 10 (inclus) et 15 exclus entre 15 (inclus) et 20 exclus entre 20 (inclus) et 25 exclus entre 25 (inclus) et 30 exclus entre 30 (inclus) et 35 exclus entre 35 (inclus) et 40 exclus Total
Effectifs 306 231 385 1180 1468 568 232 4370
centre de chaque classe 7,5 12,5 17,5 22,5 27,5 32,5 37,5 total des salaires
Total des salaires
de chaque classe
2295 2887,5 6737,5 26550 40370 18460 8700 106000
Fréquences 0,07 0,053 0,088 0,27 0,336 0,13 0,053 Moyenne
Produit Fréquence.centre 0,525 0,6625 1,54 6,075 9,24 4,225 1,9875 24,255

On retrouve le salaire moyen par le calcul : 106000/4370 = 24,25 soit environ 24250 euros.

La légère différence entre les méthodes de calcul avec les fréquences et avec les effectifs s'explique par l'arrondi des fréquences. Cependant, étant donnée la perte d'information due au regroupement en classes, cette différence est sans importance.

Médiane

On pourrait calculer la médiane comme dans l'exemple 1 avec les effectifs, mais c’est encore plus facile avec les fréquences cumulées : il suffit de regarder quand on dépasse les 50 %, c'est-à-dire la fréquence cumulée 0,5.

Salaires entre 5 (inclus) et 10 exclus entre 10 (inclus) et 15 exclus entre 15 (inclus) et 20 exclus entre 20 (inclus) et 25 exclus entre 25 (inclus) et 30 exclus entre 30 (inclus) et 35 exclus entre 35 (inclus) et 40 exclus
Fréquences 0,07 0,053 0,088 0,27 0,336 0,13 0,053
Fréquences cumulées 0,07 0,123 0,211 0,481 0,817 0,947 1

La médiane se situe donc dans la classe [25,30[, donc le salaire annuel médian se situe entre 25000 Euros et Modèle:Unité. Il est plus élevé que le salaire moyen.

Histogramme

Modèle:Définition

On représente cette étude statistique par un histogramme formé de rectangles qui recouvrent toute la classe considérée. On a placé les effectifs en ordonnées, mais on aurait pu travailler avec les fréquences.


Polygone des fréquences cumulées

Modèle:Propriété

On retrouve le résultat précédent entre 25 et 30, environ Modèle:Unité pour le salaire médian. Un calcul exact pourrait être fait en utilisant la proportionnalité ou les fonctions affines.


Modèle:Bas de page