Rozkład normalny w uczeniu maszynowym
- Poprzednia strona Rozkład danych
- Następna strona Rysunek punktowy
Rozkład danych normalnych (Normal Data Distribution)
W poprzednim rozdziale nauczyliśmy się, jak stworzyć całkowicie losową tablicę o określonym rozmiarze między dwoma określonymi wartościami.
W tym rozdziale nauczymy się, jak stworzyć tablicę, w której wartości są skupione wokół danej wartości.
W teorii prawdopodobieństwa, po wprowadzeniu formuły tego rozkładu danych przez matematyka Carla Friedricha Gaussa (Carl Friedrich Gauss), ten rozkład danych został nazwany rozkładem danych normalnych lub rozkładem Gaussa.
Przykład
Typowy rozkład danych normalnych:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
Wynik:

Komentarz:Ponieważ rozkład normalny ma cechę kształtu kuli, jest również nazywany krzywą kuli.
Wyjaśnienie histogramu
Używamy numpy.random.normal()
Metoda tworzenia tablicy (z 100000 wartościami) rysuje histogram z 100 kolumnami.
Zdefiniowaliśmy średnią jako 5.0, a odchylenie standardowe jako 1.0.
To oznacza, że te wartości powinny być skupione wokół 5.0, a rzadko odchylić się od średniej o 1.0.
Z histogramu można zobaczyć, że większość wartości znajduje się między 4.0 a 6.0, a najwyższa wartość wynosi około 5.0.
- Poprzednia strona Rozkład danych
- Następna strona Rysunek punktowy