Distribusi Data Normal Pembelajaran Mesin

Distribusi Data Normal (Normal Data Distribution)

Dalam bab sebelumnya, kita belajar bagaimana membuat array yang ukurannya acak dan berada di antara dua nilai yang diberikan.

Dalam bab ini, kita akan belajar bagaimana membuat array yang nilai concentrate di sekitar nilai yang diberikan.

Dalam probabilitas, setelah formula distribusi data ini ditemukan oleh matematikawan Carl Friedrich Gauss, distribusi data ini disebut distribusi data normal atau distribusi data Gauss.

Contoh

Distribusi data normal tipikal:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

Hasil:


Jalankan Instan

Catatan:Karena grafik distribusi normal memiliki bentuk bentuk yang mirip jam, jadi disebut garis bulan sabit.

Penjelasan Histogram

Kami menggunakan numpy.random.normal() Array yang dibuat dengan metode (dengan 100,000 nilai) di gambarkan dengan histogram 100 baris.

Kami menetapkan nilai rata-rata 5.0 dan standar deviasi 1.0.

Artinya nilai ini seharusnya berkonentrasi di sekitar 5.0, dan jarang berjauhan dari rata-rata 1.0.

Dari grafik histogram, dapat dilihat bahwa sebagian besar nilai berada di antara 4.0 hingga 6.0, nilai tertinggi sekitar 5.0.