機器學習 - 正態數據分布

正態數據分布(Normal Data Distribution)

在上一章中,我們學習了如何創建給定大小且在兩個給定值之間的完全隨機數組。

在本章中,我們將學習如何創建一個將值集中在給定值周圍的數組。

在概率論中,在數學家卡爾·弗里德里希·高斯(Carl Friedrich Gauss)提出了這種數據分布的公式之后,這種數據分布被稱為正態數據分布或高斯數據分布。

實例

典型的正態數據分布:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

結果:


運行實例

注釋:由于正態分布圖具有鐘形的特征形狀,因此也稱為鐘形曲線。

直方圖解釋

我們使用 numpy.random.normal() 方法創建的數組(具有 100000 個值)繪制具有 100 欄的直方圖。

我們指定平均值為 5.0,標準差為 1.0。

這意味著這些值應集中在 5.0 左右,并且很少與平均值偏離 1.0。

從直方圖中可以看到,大多數值都在 4.0 到 6.0 之間,最高值大約是 5.0。