Machine Learning - Normal Data Distribution

Normal Data Distribution (Normal Data Distribution)

Sa nakaraang kabanata, natutunan namin kung paano lumikha ng isang ganap na random array na may binigay na laki at nasa dalawang binigay na halaga.

Sa kabanatang ito, aaralain namin kung paano lumikha ng isang array na ang halaga ay magkalat sa paligid ng binigay na halaga.

Sa probabilidad, pagkatapos itinulak ng matematiko na si Carl Friedrich Gauss ang formula ng data distribution na ito, ang data distribution na ito ay tinawag na normal data distribution o Gauss data distribution.

Halimbawa

Tikang sa tipikal na normal data distribution:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Mga Resulta:


Run Halimbawa

Komentaryo:Dahil ang normal distribution ay may propesor na hugis na likod, kaya tinawag din itong likod na kurva.

Paliwanag ng Histograma

Ginamit namin numpy.random.normal() Ang array na nilikha ng paraan ay ginuhit na histograma na may 100 bahagi (may 100000 na halaga).

Tinukoy namin ang katumbas bilang 5.0, at ang standard deviation bilang 1.0.

Ito nangangahulugan na ang mga halaga ay dapat magkalat sa paligid ng 5.0, at bihira ang pagkakaiba sa katumbas ng 1.0.

Makikita sa histograma, ang karamihan ng halaga ay nasa 4.0 hanggang 6.0, ang pinakamataas na halaga ay humigit-kumulang 5.0.