Maskininlärning - normal datafördelning

Normaldatafördelning (Normal Data Distribution)

I föregående kapitel lärde vi oss hur vi skapar ett helt random array med en given storlek och mellan två givna värden.

I detta kapitel kommer vi att lära oss hur vi skapar ett array som koncentrerar värdena kring ett givet värde.

I sannolikhetsläran föreslog matematikern Carl Friedrich Gauss (Carl Friedrich Gauss) formeln för denna datafördelning efteråt, och denna datafördelning kallas normaldatafördelning eller Gaussdatafördelning.

Exempel

Typisk normaldatafördelning:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Resultat:


Kör instans

Kommentar:Eftersom den normalfördelningen har en klockformad form, kallas den också klockformad kurva.

Histograms förklaring

Vi använder numpy.random.normal() Metoden skapar ett array (med 100000 värden) som ritas som ett histogram med 100 rader.

Vi specificerar medelvärdet som 5.0 och standardavvikelsen som 1.0.

Detta innebär att dessa värden bör koncentreras runt 5.0 och sällan avvika från medelvärdet med mer än 1.0.

Man kan se från histogrammet att de flesta värdena ligger mellan 4.0 och 6.0, och den högsta värdet är ungefär 5.0.