Rozkład normalny w uczeniu maszynowym

Rozkład danych normalnych (Normal Data Distribution)

W poprzednim rozdziale nauczyliśmy się, jak stworzyć całkowicie losową tablicę o określonym rozmiarze między dwoma określonymi wartościami.

W tym rozdziale nauczymy się, jak stworzyć tablicę, w której wartości są skupione wokół danej wartości.

W teorii prawdopodobieństwa, po wprowadzeniu formuły tego rozkładu danych przez matematyka Carla Friedricha Gaussa (Carl Friedrich Gauss), ten rozkład danych został nazwany rozkładem danych normalnych lub rozkładem Gaussa.

Przykład

Typowy rozkład danych normalnych:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Wynik:


Uruchomienie przykładu

Komentarz:Ponieważ rozkład normalny ma cechę kształtu kuli, jest również nazywany krzywą kuli.

Wyjaśnienie histogramu

Używamy numpy.random.normal() Metoda tworzenia tablicy (z 100000 wartościami) rysuje histogram z 100 kolumnami.

Zdefiniowaliśmy średnią jako 5.0, a odchylenie standardowe jako 1.0.

To oznacza, że te wartości powinny być skupione wokół 5.0, a rzadko odchylić się od średniej o 1.0.

Z histogramu można zobaczyć, że większość wartości znajduje się między 4.0 a 6.0, a najwyższa wartość wynosi około 5.0.