آموزش ماشین‌آموخته - توزیع داده‌های نرمال

توزیع داده‌های طبیعی (Normal Data Distribution)

در فصل قبلی، ما یاد گرفتیم که چگونه یک آرایه کاملاً تصادفی با اندازه مشخص و بین دو مقدار مشخص ایجاد کنیم.

در این فصل، ما یاد می‌گیریم که چگونه یک آرایه ایجاد کنیم که مقادیر در اطراف یک مقدار خاص متمرکز شوند.

در نظریه احتمالات، پس از ارائه فرمول این توزیع داده‌ها توسط ریاضیدان کارل فردریش گاوس (Carl Friedrich Gauss)، این توزیع داده‌ها به توزیع داده‌های طبیعی یا توزیع گاوس معروف شد.

مثال

توزیع داده‌های طبیعی معمولی:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

نتیجه:


اجرای مثال

نکته:به دلیل اینکه نمودار توزیع طبیعی دارای شکل ویژه‌ای به شکل قلاب است، بنابراین به آن منحنی قلابی نیز گفته می‌شود.

توضیح هندسه

ما از numpy.random.normal() ارائه‌ای از آرایه‌ای که توسط روش ایجاد شده (با 100000 مقدار) یک نمودار هندسی با 100 ستون ترسیم می‌کند.

ما میانگین را 5.0 و انحراف معیار را 1.0 مشخص می‌کنیم.

این بدان معناست که این مقادیر باید در حدود 5.0 متمرکز شوند و به ندرت از میانگین 1.0 منحرف شوند.

از نمودار هندسی می‌توان دید که بیشتر مقادیر بین 4.0 تا 6.0 قرار دارند و بیشترین مقدار حدود 5.0 است.