機械学習 - 正規分布

正規データ分布(Normal Data Distribution)

前の章では、指定されたサイズと二つの指定された値の間に完全にランダムな配列を作成する方法を学びました。

この章では、値が指定された値の周りに集中する配列を作成する方法を学びます。

確率論において、数学者カール・フリードリヒ・ガウス(Carl Friedrich Gauss)がこのデータ分布の公式を提案した後、このデータ分布は正規データ分布またはガウスデータ分布と呼ばれるようになりました。

典型的な正規データ分布:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

結果:


実行例

注記:正規分布図は鐘形の特徴的な形状を持つため、鐘形曲線とも呼ばれます。

ヒストグラムの説明

私たちは使用しています numpy.random.normal() 方法で作成された配列(100,000 個の値を持つ)を 100 列のヒストグラムで描画します。

平均値を 5.0、標準偏差を 1.0 に指定しました。

これにより、これらの値は 5.0 付近に集中し、平均値から 1.0 以下にわずかにずれることが少ないと考えられます。

ヒストグラムから見て、ほとんどの値が 4.0 から 6.0 の間にあります。最高値は約 5.0 です。