Initiation à la statistique/Médiane
Les statistiques sont le domaine des mathématiques dont le but est d’organiser de grandes masses de données pour les utiliser et les interpréter.
Elles sont utiles dans les sciences (notamment humaines : économie, sociologie, démographie…) et dans des domaines appliqués : commerce, médecine…
Exemple 1 : Les notes des élèves d’une classe à un devoir
Les élèves d’une classe ont obtenu les notes suivantes à un devoir :
On présente les résultats de l’enquête sous forme d’un tableau d’effectifs.
Moyenne
Tableau des effectifs et moyenne
L’effectif d’une valeur est le nombre de fois où cette valeur apparaît.
| notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
| effectifs | 1 | 1 | 2 | 4 | 3 | 2 | 1 | 1 | 1 | 16 |
| Produit | 5 | 8 | 18 | 40 | 33 | 24 | 13 | 14 | 16 | 171 |
Une première méthode permettant de calculer la moyenne de la classe, consiste tout d’abord à déterminer le total de points que totalise la classe car par définition la moyenne de la classe répond à la question suivante:
Si tous les élèves avaient eu la même note, quelle serait-elle pour que la classe totalise toujours ce même nombre de points ?
Pour calculer la note moyenne de la classe, on applique donc la formule suivante :
Tableau des fréquences et moyenne
La fréquence de la note 10, par exemple, se calcule ainsi :
En procédant de même pour les autres notes, on obtient le tableau des fréquences (qu'on ne transforme pas en pourcentages pour calculer la moyenne) :
| notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 | Total |
| fréquences | 0,0625 | 0,0625 | 0,125 | 0,25 | 0,1875 | 0,125 | 0,0625 | 0,0625 | 0,0625 | 1 |
| Produit | 0,3125 | 0,5 | 1,125 | 2,5 | 2,0625 | 1,5 | 0,8125 | 0,875 | 1 | 10,6875 |
On trouve ici la seconde méthode de calcul de la moyenne comme somme des produits des notes par leurs fréquences.
Médiane
Tableau des effectifs cumulés et médiane
Reprenons l'exemple 1 des notes des élèves :
| notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 |
| effectifs | 1 | 1 | 2 | 4 | 3 | 2 | 1 | 1 | 1 |
| effectifs cumulés | 1 | 2 | 4 | 8 | 11 | 13 | 14 | 15 | 16 |
Modèle:Début cadre La médiane d’une série statistique quantitative est
la valeur du caractère qui partage l'effectif en deux parties égales.
Ici, on peut lire la médiane dans le tableau des effectifs ;
comme il y a 16 élèves, l'effectif se partage entre les 8 notes les plus basses
et les 8 notes les plus hautes.
La huitième note la plus haute est 11.
La huitième note la plus basse est 10.
On prendra la médiane entre les deux, soit 10,5
Tableau des fréquences cumulées
En procédant comme pour les effectifs cumulés, on peut construire
un tableau des fréquences cumulées,
par exemple avec l'exemple 1 des notes :
| notes | 5 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 16 |
| fréquences en % | 6,25 | 6,25 | 12,50 | 25,00 | 18,75 | 12,50 | 6,25 | 6,25 | 6,25 |
| fréquences cumulées en % | 6,25 | 12,5 | 25 | 50 | 68,75 | 81,25 | 87,5 | 93,75 | 100 |
Etendue
Modèle:Début cadre L'étendue d’une série statistique quantitative est l'écart entre sa plus grande valeur et sa plus petite valeur. Modèle:Fin cadre
Exemple 1 des notes
La note la plus élevée est 16, la note la plus basse est 5
L'étendue est donc :
Regroupement en classes : exemple 2 des salaires
Lorsque le caractère statistique peut prendre un grand nombre de valeurs différentes, on les regroupe en classes (ou intervalles, ou tranches …).
En troisième, on travaille avec des classes de même largeur.
Tableaux et moyenne
Répartition des revenus annuels en milliers d’euros dans une population de 4370 personnes.
Modèle:Début cadre Quand on regroupe une série statistique en classe, on calcule la moyenne en prenant comme valeurs les centres de chaque classe. Modèle:Fin cadre
On a regroupé dans le même tableau les effectifs et les fréquences ainsi que les centres des classes.
| Salaires (en milliers d'euros) | entre 5 (inclus) et 10 exclus | entre 10 (inclus) et 15 exclus | entre 15 (inclus) et 20 exclus | entre 20 (inclus) et 25 exclus | entre 25 (inclus) et 30 exclus | entre 30 (inclus) et 35 exclus | entre 35 (inclus) et 40 exclus | Total |
| Effectifs | 306 | 231 | 385 | 1180 | 1468 | 568 | 232 | 4370 |
| centre de chaque classe | 7,5 | 12,5 | 17,5 | 22,5 | 27,5 | 32,5 | 37,5 | total des salaires |
| Total des salaires de chaque classe |
2295 | 2887,5 | 6737,5 | 26550 | 40370 | 18460 | 8700 | 106000 |
| Fréquences | 0,07 | 0,053 | 0,088 | 0,27 | 0,336 | 0,13 | 0,053 | Moyenne |
| Produit Fréquence.centre | 0,525 | 0,6625 | 1,54 | 6,075 | 9,24 | 4,225 | 1,9875 | 24,255 |
On retrouve le salaire moyen par le calcul : 106000/4370 = 24,25 soit environ 24250 euros.
La légère différence entre les méthodes de calcul avec les fréquences et avec les effectifs s'explique par l'arrondi des fréquences. Cependant, étant donnée la perte d'information due au regroupement en classes, cette différence est sans importance.
Médiane
On pourrait calculer la médiane comme dans l'exemple 1 avec les effectifs, mais c’est encore plus facile avec les fréquences cumulées : il suffit de regarder quand on dépasse les 50 %, c'est-à-dire la fréquence cumulée 0,5.
| Salaires | entre 5 (inclus) et 10 exclus | entre 10 (inclus) et 15 exclus | entre 15 (inclus) et 20 exclus | entre 20 (inclus) et 25 exclus | entre 25 (inclus) et 30 exclus | entre 30 (inclus) et 35 exclus | entre 35 (inclus) et 40 exclus |
| Fréquences | 0,07 | 0,053 | 0,088 | 0,27 | 0,336 | 0,13 | 0,053 |
| Fréquences cumulées | 0,07 | 0,123 | 0,211 | 0,481 | 0,817 | 0,947 | 1 |
La médiane se situe donc dans la classe [25,30[, donc le salaire annuel médian se situe entre 25000 Euros et Modèle:Unité. Il est plus élevé que le salaire moyen.
Histogramme
On représente cette étude statistique par un histogramme formé de rectangles qui recouvrent toute la classe considérée. On a placé les effectifs en ordonnées, mais on aurait pu travailler avec les fréquences.
Polygone des fréquences cumulées
On retrouve le résultat précédent entre 25 et 30, environ Modèle:Unité pour le salaire médian. Un calcul exact pourrait être fait en utilisant la proportionnalité ou les fonctions affines.