Aprendizado de Máquina - Distribuição Normal

Distribuição de dados normal (Normal Data Distribution)

No capítulo anterior, aprendemos como criar um array completamente aleatório entre dois valores dados e de um tamanho específico.

Neste capítulo, vamos aprender como criar um array que concentre valores ao redor de um valor dado.

Em probabilidade, após a matemático Carl Friedrich Gauss propor a fórmula dessa distribuição de dados, essa distribuição de dados é chamada de distribuição de dados normal ou distribuição de dados Gaussiana.

Exemplo

Distribuição de dados normal típica:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Resultados:


Executar Instância

Notas:Devido ao gráfico de distribuição normal ter uma forma característica em forma de sino, também é chamado de curva em forma de sino.

Explicação do Histograma

Usamos numpy.random.normal() O array criado pelo método (com 100000 valores) é plotado em um histograma com 100 colunas.

Nós especificamos a média de 5,0 e a desvio padrão de 1,0.

Isso significa que esses valores devem estar concentrados em torno de 5,0 e raramente desviarem-se da média em 1,0.

Do gráfico de histograma, pode-se ver que a maioria dos valores está entre 4,0 e 6,0, e o valor máximo é aproximadamente 5,0.