Apprentissage non supervisé/Méthode des k-moyennes

De testwiki
Version datée du 22 août 2023 à 17:09 par imported>Crochet.david.bot (Robot : remplacement de texte automatisé (-\n(==={0,3})(?: *)([^\n=\s]+)(?: *)\1(?: *)\n +\n\1 \2 \1\n))
(diff) ← Version précédente | Version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Modèle:Chapitre

La méthode des k-moyennes (k-means en anglais) est une méthode de partitionnement des données. Elle permet de regrouper en k partitions (clusters en anglais) les données qui se ressemblent. Pour rappel, nous sommes en contexte non supervisé, c'est-à-dire que nous ne connaissons pas la vérité terrain sur les données.

Définition formelle

Considérons un ensemble de points (x1, x2, …, xn). La méthode des k-moyennes consiste à partitionner les n points en k ensembles S = {S1, S2, …, Sk} (kn) en minimisant la distance entre les points à l'intérieur de chaque partition :

argmin𝐒i=1k𝐱jSi𝐱jμi2

μi est le barycentre des points dans Si.

Algorithme

Problème simple

Limites de la méthode

Modèle:Bas de page