Apprentissage automatique - Distribution de données normales

Distribution de données normale (Normal Data Distribution)

Dans le chapitre précédent, nous avons appris à créer un tableau complètement aléatoire entre deux valeurs données de taille donnée.

Dans ce chapitre, nous allons apprendre à créer un tableau qui concentre les valeurs autour d'une valeur donnée.

Dans la probabilité, après que le mathématicien Carl Friedrich Gauss ait proposé l'équation de cette distribution de données, cette distribution de données est appelée distribution de données normale ou distribution de données Gaussienne.

Exemple

Distribution de données typique normale :

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Résultat :


Exécution de l'exemple

Remarque :Comme la distribution normale a une forme en cloche, elle est également appelée courbe en cloche.

Explication de l'histogramme

Nous utilisons numpy.random.normal() Le tableau créé par la méthode (composé de 100000 valeurs) est dessiné avec un histogramme de 100 colonnes.

Nous spécifions une moyenne de 5,0 et une déviation standard de 1,0.

Cela signifie que ces valeurs devraient se concentrer autour de 5,0 et être rarement éloignées de la moyenne de 1,0.

On peut voir à partir du histogramme que la plupart des valeurs se trouvent entre 4,0 et 6,0, et la valeur maximale est d'environ 5,0.