Apprentissage automatique - Modèles médianes et moyens

Moyenne, médiane et mode

Que pouvons-nous apprendre d'un ensemble de nombres ?

Dans l'apprentissage automatique (et la mathématique), il existe généralement trois valeurs que nous intéressent :

  • Moyenne (Mean) - La valeur moyenne
  • Médiane (Median) - La valeur médiane, également appelée médiane
  • Mode (Mode) - La valeur la plus fréquente

Par exemple : nous avons enregistré les vitesses de 13 voitures :

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

Qu'est-ce que la moyenne, la médiane ou la valeur la plus courante ?

Moyenne

La moyenne est la valeur moyenne.

Pour calculer la moyenne, trouvez la somme de toutes les valeurs, puis divisez la somme par le nombre de valeurs :

(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77

Le module NumPy possède des méthodes pour cette fin :

Exemple

Utilisez NumPy mean() La méthode détermine la vitesse moyenne :

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)

Exécution de l'exemple

Médiane

La médiane est la valeur au milieu après avoir trié tous les valeurs :

77, 78, 85, 86, 86, 86, 87, 87, 88, 94, 99, 103, 111

Il est important de trier les nombres avant de trouver la médiane.

Le module NumPy possède des méthodes pour cette fin :

Exemple

Utilisez NumPy median() Méthode pour trouver la valeur médiane :

import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Exécution de l'exemple

Si deux nombres se trouvent au milieu, divisez la somme de ces nombres par 2.

, 77, 78, 85, 86, 86, 86, 87, 87, 94, 98, 99, 103
(86 + 87) / 2 = 86.5

Exemple

Utilisez le module NumPy :

import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)

Exécution de l'exemple

Mode

La mode est la valeur la plus fréquemment rencontrée :

99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86 = 86

Le module SciPy possède des méthodes pour cet objectif :

Exemple

Utilisez SciPy mode() Méthode pour trouver le nombre le plus souvent rencontré :

from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)

Exécution de l'exemple

Résumé du chapitre

La moyenne, la médiane et la mode sont des techniques fréquemment utilisées en apprentissage automatique, par conséquent, il est important de comprendre les concepts sous-jacents.