Aprendizado de Máquina - Distribuição Normal
- Página Anterior Distribuição de Dados
- Próxima Página Gráfico de Dispersão
Distribuição de dados normal (Normal Data Distribution)
No capítulo anterior, aprendemos como criar um array completamente aleatório entre dois valores dados e de um tamanho específico.
Neste capítulo, vamos aprender como criar um array que concentre valores ao redor de um valor dado.
Em probabilidade, após a matemático Carl Friedrich Gauss propor a fórmula dessa distribuição de dados, essa distribuição de dados é chamada de distribuição de dados normal ou distribuição de dados Gaussiana.
Exemplo
Distribuição de dados normal típica:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
Resultados:

Notas:Devido ao gráfico de distribuição normal ter uma forma característica em forma de sino, também é chamado de curva em forma de sino.
Explicação do Histograma
Usamos numpy.random.normal()
O array criado pelo método (com 100000 valores) é plotado em um histograma com 100 colunas.
Nós especificamos a média de 5,0 e a desvio padrão de 1,0.
Isso significa que esses valores devem estar concentrados em torno de 5,0 e raramente desviarem-se da média em 1,0.
Do gráfico de histograma, pode-se ver que a maioria dos valores está entre 4,0 e 6,0, e o valor máximo é aproximadamente 5,0.
- Página Anterior Distribuição de Dados
- Próxima Página Gráfico de Dispersão