Aprendizaje automático - Distribución de datos normales

Distribución de datos normal (Normal Data Distribution)

En el capítulo anterior, aprendimos a crear un array completamente aleatorio de un tamaño dado entre dos valores dados.

En este capítulo, aprenderemos a crear un array que concentre valores alrededor de un valor dado.

En la teoría de probabilidad, después de que el matemático Carl Friedrich Gauss propuso la fórmula de esta distribución de datos, esta distribución de datos se conoce como distribución de datos normales o distribución de datos Gaussiana.

Ejemplo

Distribución de datos normal típica:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Resultados:


Ejecutar ejemplo

Notas:Dado que la distribución normal tiene una forma característica en forma de campana, también se conoce como curva de campana.

Explicación del histograma

Usamos numpy.random.normal() El método crea un array (con 100000 valores) y lo representa en un histograma con 100 columnas.

Especificamos un valor medio de 5.0 y una desviación estándar de 1.0.

Esto significa que estos valores deben concentrarse alrededor de 5.0 y raramente desviarse del promedio en 1.0.

A partir del gráfico de histograma, se puede ver que la mayoría de los valores están entre 4.0 y 6.0, y el valor máximo es aproximadamente 5.0.