機器學習 - 正態數據分布
正態數據分布(Normal Data Distribution)
在上一章中,我們學習了如何創建給定大小且在兩個給定值之間的完全隨機數組。
在本章中,我們將學習如何創建一個將值集中在給定值周圍的數組。
在概率論中,在數學家卡爾·弗里德里希·高斯(Carl Friedrich Gauss)提出了這種數據分布的公式之后,這種數據分布被稱為正態數據分布或高斯數據分布。
實例
典型的正態數據分布:
import numpy import matplotlib.pyplot as plt x = numpy.random.normal(5.0, 1.0, 100000) plt.hist(x, 100) plt.show()
結果:

注釋:由于正態分布圖具有鐘形的特征形狀,因此也稱為鐘形曲線。
直方圖解釋
我們使用 numpy.random.normal()
方法創建的數組(具有 100000 個值)繪制具有 100 欄的直方圖。
我們指定平均值為 5.0,標準差為 1.0。
這意味著這些值應集中在 5.0 左右,并且很少與平均值偏離 1.0。
從直方圖中可以看到,大多數值都在 4.0 到 6.0 之間,最高值大約是 5.0。