기계 학습 - 정규 분포

정态 데이터 분포(Normal Data Distribution)

이전 장에서는 주어진 크기와 주어진 두 값을 사이에 있는 완전히 무작위 배열을 생성하는 방법을 배웠습니다.

이 장에서는 값을 주어진 값 주위에 집중된 배열을 생성하는 방법을 배울 것입니다.

정확한 확률론에서, 수학자 카를 프리드리히 고스(Carl Friedrich Gauss)가 이 데이터 분포의 공식을 제시한 후, 이 데이터 분포는 정态 데이터 분포나 고스 데이터 분포로 불리게 되었습니다.

예제

유형적인 정态 데이터 분포:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

결과:


실행 예제

주의事项:정态分布은 형상이 타원형이며, 따라서 타원형 곡선으로도 알려져 있습니다.

하이스트 그래프 설명

사용했습니다. numpy.random.normal() 100,000 개의 값을 가진 배열을 생성한 후, 100列为 간격을 두고 하이스트 그래프를 그렸습니다.

평균值为 5.0, 표준편차值为 1.0을 지정했습니다.

따라서 이 값들은 5.0 주위에 집중되어야 하며, 평균에서 1.0으로부터 적게 벗어날 수 있습니다.

하이스트 그래프에서 보면 대부분의 값이 4.0에서 6.0 사이에 있으며, 가장 높은 값은 약 5.0입니다.