Apprentissage automatique - Écart type

Qu'est-ce que l'écart-type ?

L'écart-type (Standard Deviation, également connu sous le nom de variance moyenne) est un nombre qui décrit l'étendue des valeurs.

Une petite déviation standard indique que la plupart des nombres sont proches de la moyenne (moyenne).

Une grande déviation standard indique que ces valeurs se répartissent sur une gamme plus large.

Par exemple : cette fois, nous avons enregistré les vitesses de 7 voitures :

vitesse = [86,87,88,86,87,85,86]

L'écart-type est :

0.9

Cela signifie que la plupart des valeurs sont dans une gamme de 0.9 autour de la moyenne, soit 86.4.

Travaillons sur un ensemble de nombres plus large :

speed = [32,111,138,28,59,77,97]

L'écart-type est :

37.85

Cela signifie que la plupart des valeurs se trouvent dans une gamme de 37.85 autour de la moyenne (moyenne de 77.4).

Comme vous pouvez le voir, une grande déviation standard indique que ces valeurs se répartissent sur une gamme plus large.

Le module NumPy a une méthode pour calculer l'écart-type :

Exemple

Utilisez NumPy std() Méthode pour trouver l'écart-type :

import numpy
vitesse = [86,87,88,86,87,85,86]
x = numpy.std(vitesse)
print(x)

Exécution de l'instance

Exemple

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(vitesse)
print(x)

Exécution de l'instance

Variance

La variance est une autre valeur numérique qui indique l'étendue des valeurs.

En réalité, si vous prenez la racine carrée de la variance, vous obtiendrez l'écart-type !

Ou inversement, si vous multipliez l'écart-type par lui-même, vous obtiendrez la variance !

Pour calculer la variance, vous devez effectuer les opérations suivantes :

1. Calculer la moyenne :

(32+111+138+28+59+77+97) / 7 = 77.4

2. Pour chaque valeur : trouver la différence avec la moyenne :

 32 - 77.4 = -45.4
111 - 77.4 =  33.6
138 - 77.4 =  60.6
 28 - 77.4 = -49.4
 59 - 77.4 = -18.4
 77 - 77.4 = - 0.4
 97 - 77.4 =  19.6

3. Pour chaque différence : trouver la valeur au carré :

(-45.4)2 = 2061.16 
 (33.6)2 = 1128.96 
 (60.6)2 = 3672.36 
(-49.4)2 (-49.4) 
= 2440.362 (-18.4) 
=  338.562 (- 0.4) 
 =    0.162 (19.6)

= 384.16

4. La variance est la moyenne de ces carrés de différences :

(2061.16+1128.96+3672.36+2440.36+338.56+0.16+384.16) / 7 = 1432.2

Exemple

Heureusement, NumPy dispose d'une méthode pour calculer la variance : var() Méthode pour déterminer la variance :

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.var(speed)
print(x)

Exécution de l'instance

Écart type

Comme nous le savons, la formule pour calculer l'écart type est la racine carrée de la variance :

√ 1432.25 = 37.85

Ou, comme dans l'exemple ci-dessus, utilisez NumPy pour calculer l'écart type :

Exemple

Utilisez la méthode std() de NumPy pour trouver l'écart type :

import numpy
speed = [32,111,138,28,59,77,97]
x = numpy.std(speed)
print(x)

Exécution de l'instance

Symbole

L'écart type est généralement représenté par le symbole Sigmaσ

La variance est généralement représentée par le symbole Sigma carré σ2 Représentation

Résumé du chapitre

L'écart type et la variance sont des termes couramment utilisés en apprentissage automatique, il est donc important de comprendre comment les obtenir et les concepts sous-jacents.